翻译(2)

2019-04-14 15:28

高速的权衡。

3指数分布

该指数分布广泛用在离散事件仿真,它是用来模型中的等待时间分布,直到一些事件发生。据估计,如果某些事件发生在rateλper单位时间,例如在上

averageλshoppers每小时到达排队结账,那么之间的事件给予的时间与速度parameterλ指数分布的概率密度函数(PDF)F和累积分布函数(CDF)的F:

指数分布可以通过产生的反演方法,即民防部队是倒,提供了一个指数和随机输入公式:

这是在第2节,所述的情况的例子,这是至关重要的价值观非常接近零,可产生,但零本身永远不会产生的。通常一个处理不同的价值观ofλwithin通过生成标准指数分布随机数,其中λ= 1,然后由不同的值除以模拟ofλfor不同的发生率。 一个完整的对数功能单位代表的硬件资源大量投资,因而它不是一种资源,指数生成随机数的有效方法。但是它具有方便的巨大优势,并已在一些模拟7]。另一种方法是使用简单的表,查询[8],但是这需要较大的表,并在分配的尾部穷人的覆盖面。在这里,我们将开发一些也很容易使用,但它们提供更好的效率的简单方法。

对高效发电的关键是要注意公式11可分割成几个部分:

这仅仅是经典的乘法减少,这通常用于计算对数。然而,不使用现成的对数单位的好处是我们可以治疗发生器分开两半:不是的缓冲数据,以确保该延迟在整个数数据路径一样,他每延迟针对部分可以用来匹配最大化潜伏期没有资源的速度。

我们必须 论代很简单,因为我们已经知道如何生成一个标准的几何分布K表。

决定在哪个值较高截断提供更大的覆盖范围值的分布尾部的分布。一个保守的选择,选择= 62,给予0,§ K,一个§ 63,这意味着缺少尾部有概率,机管局2。但是,应用程序开发人员可以选择使用较低的值,如果他们知道了广泛的尾巴覆盖并不重要。

查表特别是在诸如的Virtex 他们用乘法 - 可以实现任何一个常数乘数或查表。

- 5和Stratix - 3 FPGA的最新的吸引力,因为这两种体系结构有6 - LUT的,让每个表位被映射到一个对照表。即使在旧的4 LUT的体系结构查表仍然有效,与每四个LUT表位需要,或更少,如果减少到48或32。

机管局[0.5, 其中M的生成,1)是更有趣的,需要将资源的使用情况和统计之

间的质量作出的选择。最简单和最不发达国家的资源密集型的选择,是制表x在M的等距值,然后执行表查找。这种方法的缺点是,发生器,星光大道分布稀疏点集,并能生产出最显着的价值。这是特别明显,在第一部分(k = 0时),它意味着50%的时间只不同的值会发生。这是否是有问题的稀疏取决于应用程序消耗的随机数字,对查找表的大小。如果一个应用程序产生随机数比较(例如早期之间作出选择的两个事件),那么这个方法可能是不恰当的,因为这将是比较普遍的两台发生器以产生相同的随机时间。但是,如果只是一个指数随机数是在模拟器使用,那么这种方法可能是不够的,特别是如果一个大的块RAM可以使用。例如,使用= 18的Virtex - 5 RAMB 36允许有用= 11,而在Stratix - 3 M144K提供了一个非常令人尊敬的威胁下,在相同的宽度13。

一个更精确的方法是升级到线性插值,基本上从0度表移动到一个degree1表。我们首先选择表以提供最大限度的民防部队在段边界的准确度0系数,然后选择度- 1的系数将跨越之间的界限。它不会提供一个极大极小近似,但它具有简单的优点。幸运的范围是[0.5,1相对平稳),因此给予256或多个表项的近似相当接近。在硬件资源方面,乘法累加为度,一到诸如自然多项式的Virtex - 5 DSP48E的DSP模块的地图需要。

表2总结了基于表格的发生器性能和线性发生器。一如以往,切片计数包括用来产生均匀输入位的资源,而资源的数量和FF LUT的反映只是在指数发生器使用的资源。一个关键的一点是针对从高层次的韩德尔- C是非常有效的DSP48E架构,充分利用乘累加寄存器的数据路径和由此产生的资源,而无需直接实例化。这样可以达到约400MHz到在Virtex - 5,保持家庭无关的代码的速度。

这些指数发生器偏爱统计质量的速度和效率,因此它是重要的特点是什么造成的质量。我们使用的安德森,亲爱的测试,以衡量质量,它使用一个数据样本经验民防部队估计的可能性,将数据从一个给定分布来(在我们的情况下,指数分布)。的可能性为0和1之间的值所,称为p值,与P -值非常接近于零,这表明数据不遵循指数分布。图4给出的P -方法的两代值增加样本大小。

出人意料的是,线性方法其实比表法更糟的是,未能通过测试样品的果断左右,而表的方法达到。这似乎是因为从线性插值产生民防系统偏差,该测试可以检测,而表格的方法有一个准确的(但非常低的分辨率)民防部队。该表的编制方法最终失败,因为测试发现,该恒星的分布是离散的,造成了指数民防部队从不同类型的偏差。尽管如此,仍然有直线发生器的价值,因为它提供了一个密集点集,所以给出了一个连续变量,这在一些关键的应用更好的印象。 4结论

随机数生成器的蒙特卡罗模拟的基本构建块,其效率会影响内部器件的并行度,可以通过空间尺度实现。虽然往往是产生浮点和指数分布随机使用硬件浮点库方便的方法,论证了有显着的效率和性能在这样做的意义。不过,我们已经表明,更复杂的方法并不需要很复杂,并可能导致在资源使用减少了75%,或者50%的性能提高。

未来的工作将审查产生指数分布,包括替代方法来近似0.5至1如CORDIC,更复杂的方法。我们还打算研究方法的不同,质量的影响,试图在效率的特点,性能和质量方面的统计发生器。 致谢

在英国工程和物理科学研究理事会(批准引用EP/D062322/1和EP/C549481/1,阿尔法数据,Celoxica和赛灵思的支持表示感谢。


翻译(2).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:北京的春节教学实录

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: