注册

定时器组件在游戏业务中的重要性及实现方式

定时器,是一个比较常见的组件。单就服务端来说,框架层面须要利用定时器来做会话的超时,应用层面须要利用定时器来处理一些跟时间有关的业务逻辑。对于游戏这些大量需求定时器的业务,一个简单高效的定时器组件是必不可少的。

定时器组件的实现可以分为两部份:

第一部份比较简单,并且实现方法多种多样,但是基本都是跟语言相关的,因而并不是本文重点。所谓具象成的概念似乎就是指使用者怎样来用。

内核资料直通车:Linux内核源码技术学习路线+视频教程代码资料

学习直通车(腾讯课堂免费报考):Linux内核源码/显存调优/文件系统/进程管理/设备驱动/网路合同栈

第二部份其实比起第一部份须要更多的代码量,并且实现方法很有限。

这些模型用处就是简单,找个学过数据结构的结业生能够写下来,不容易有bug。add的时间复杂度是n(lgn),timeout的时间复杂度也是n(lgn)。

然而,假定我们的业务系统假如面对的是这样的需求:短期内注册了大量短时间内就要timeout的timer。很其实,最小堆的实现就有点难堪了。

下边步入正文,小说君就介绍下我们在应用层怎样实现一个linux内核风格的定时器。语言以C#为例。

为了做性能对比,我们要先实现一个基于最小堆的定时器管理器,最小堆的插口如下linux 应用定时器,具体实现就不港了,虽然是最基础的数据结构。

public class PriorityQueue : IEnumerable
{
public PriorityQueue(IComparer comparer);
public void Push(T v);
public T Pop();
public T Top();
}

public interface ITimeManager
{
ITimer AddTimer(uint afterTick, OnTimerTimeout callback, params object[] userData);
FixedTick();
}

public class TrivialTimeManager : ITimeManager
{
// ...
}

之后是linux内核风格定时器的管理器实现。首先有一个设计前提:

我们须要用tick来定义整个系统的时间精度下限。例如说对于游戏来说,10ms以下的精度不须要care,因而我们可以把tick的宽度定为10ms。也就是说先挂起来的WaitFor(8ms)和后挂起来的WaitFor(5ms),有可能是后者先timeout的。一个tick为10ms,这么一个32bit的tick能抒发的时间细度就有将近500天嵌入式linux培训,远超过一个服务器组不重启的时间了。

虽然这些定时器实现,就是由于这个抉择,在面对之前提到的问题时,方才具有了更佳的性能表现。每次按照tick领到timeout数组,直接dispatch,领到这个数组的时间是一个常数,而最小堆方式领到这个数组须要的时间是m*lgn。

因为空间有限,我们不可能做到每位即将timeout的tick都有对应的数组。考虑到虽然80%以上的timer的时间都不会超过2.55s,我们只针对前256个tick做这些优化举措即可。

那怎么处理注册的256tick以后的timer?我们可以把时间还比较长的timer置于更粗细度的数组中,等到还剩下的tick数大于256以后再把她们取下来重新整理一下数组能够搞定。

假如我们保证每一次tick都严格的做到:

保证这两点,就须要每位tick都对所有数组做一次整理。这样就得不偿失了,所以这儿有个trade-off,就是我通过一个表针(index),来标记我当前处理的position,每过256tick是一个cycle,才进行一次整理。而整理的成本就通过分摊在256tick中,增加了实际上的单位时间成本。

概念比较具象,接出来贴一部份代码。

常量定义:


public const int TimeNearShift = 8;
public const int TimeNearNum = 1 << TimeNearShift;// 256
public const int TimeNearMask = TimeNearNum - 1;// 0x000000ff
public const int TimeLevelShift = 6;
public const int TimeLevelNum = 1 << TimeLevelShift;// 64
public const int TimeLevelMask = TimeLevelNum - 1;// 00 00 00 (0011 1111)

基础数据结构:

using TimerNodes = LinkedList;
private readonly TimerNodes[TimeNearNum] nearTimerNodes;
private readonly TimerNodes[4][TimeLevelNum] levelTimerNodes;

相当于是256+4*64个timer数组。

tick有32位,每一个tick只会timeout掉expire与index相同的timer。

循环不变式保证near表具有这样几个性质:

level表有4个,分别对应9到14bit,15到20bit,21到26bit,27到32bit。

因为原理都类似,我这儿拿9到14bit的表来说下循环不变式:

有了数据结构和循环不变式,前面的代码也就容易理解了。主要列一下AddTimer的逻辑和Shift逻辑。

private void AddTimerNode(TimerNode node)
{
var expire = node.ExpireTick;
if (expire < index)
{
throw new Exception();
}
// expire 与 index 的高24bit相同
if ((expire | TimeNearMask) == (index | TimeNearMask))
{
nearTimerNodes[expire & TimeNearMask].AddLast(node);
}
else
{
var shift = TimeNearShift;
for (int i = 0; i < 4; i++)
{
// expire 与 index 的高bit相同
var lowerMask = (1 <> shift)&TimeLevelMask].AddLast(node);
break;
}
shift += TimeLevelShift;
}
}
}

private void TimerShift()
{
// TODO index回绕到0的情况暂时不考虑
index++;
var ct = index;// mask0 : 8bit
// mask1 : 14bit
// mask2 : 20bit
// mask3 : 26bit
// mask4 : 32bit
var partialIndex = ct & TimeNearMask;
if (partialIndex != 0)
{
return;
}
ct >>= TimeNearShift;
for (int i = 0; i >= TimeLevelShift;
continue;
}
ReAddAll(levelTimerNodes[i], partialIndex);
break;
}
}

以上代码用c/c++重画后尝尝鲜味更佳。

实现大约就是这种了,接出来我们测一下究竟linux内核风格定时器比最小堆实现的定时器快了多少。

建立的测试用例和测试方式:

static IEnumerable BuildTestCases(uint first, uint second)
{
var rand = new Random();
for (int i = 0; i < first; i++)
{
yield return new TestCase()
{
Tick = (uint)rand.Next(256),
};
}
for (int i = 0; i < 4; i++)
{
var begin = 1U << (8 + 6*i);
var end = 1U << (14 + 6*i);
for (int j = 0; j < rand.Next((int)second * (4 - i)); j++)
{
yield return new TestCase()
{
Tick = (uint)rand.Next((int)(begin+end)/2),
};
}
}
}

{
var maxTick = cases.Max(c => c.Tick);
var results = new HashSet();
foreach (var c in cases)
{
TestCase c1 = c;
mgr.AddTimer(c.Tick, (timer, data) =>
{
if (mgr.FixedTicks == c1.Tick)
results.Add((uint) data[0]);
}, c.Id);
}
var begin = DateTime.Now;
for (int i = 0; i < maxTick+1; i++)
{
mgr.FixedTick();
}
var end = DateTime.Now;
}

建立测试用例时的参数first指大于等于256tick的timer数目,second是指小于256tick的timer数目。

first固定为一千万的测试结果:

加速比的波动不是非常显著,而且假如second继续降低,linux内核定时器的加速比实际上还是会因为shift频度的提高而逐渐增加。

second固定为1000的情况:

跟第一次测试的推论差不多,256tick以内的timer占比越高,相比最小堆定时器的优势越大。

最终结论,linux内核定时器比起最小堆定时器的优势还是很显著的,大部份情况下都有2倍以上的性能表现,强烈建议采用。

此次的代码放到github上linux 应用定时器,并且因为订阅号文章里没办法放链接linux软件,只要后台给小说君发消息「定时器」就会手动回复github链接。这个项目里不仅有一个工业级的linux风格定时器实现代码,还有小说君实现的一套基于这个定时器的Unity3D风格的Coroutine。

以上就是定时器组件在游戏业务中的重要性及实现方式的详细内容,更多请关注CTO智库其它相关文章!