第二章 蒙特卡罗方法(又统称:统计试验方法 )
在第一章我们看到了关于解决反问题在概率分布模型空间最普遍的方案,当它的概率分布唯一时,在模型空间是非常简单的,(例如,它仅有一个最大值),可以用分析技术来表示。
对于一般的概率分布,需要在模型空间上广泛的探索,除去维数较小的,因为这样不能系统概括,(根据位数空间大量的点群)设计好随机(或非随机)可以探索解决了许多复杂的问题,这些随机方法被洛斯阿拉莫斯团队开玩笑的叫做“蒙特卡洛方法”,Metropplis抽样算法,现在已经建立被叫做“蒙特卡罗”。
2.1 介绍
几个世纪前蒙特卡罗(即随机的)方法就被用于计算,例如,可以用蒙特卡罗方法来估算?:对于一个普通的楼层,等同宽度W的钢带,抛出长为W/2的针,这个针相交的凹槽,在地板上的概率等于1?(勒克莱尔,乔治.路易伯爵布冯[1907至88年])。以50为一系列做观察,做100次试验,在1850年由沃尔夫在苏黎世导致对3.1596?0.0524?的值。在数值方法中,针的行进被替换一个随机生成的数字,由计算机的代码一个域,
其中蒙特卡罗计算是平时对于数值计算 大维空间积分:函数在一个普通的系统评价网格是不可能的(太多了点就被要求),并在蒙特卡罗采样 功能可以提供的结果的估计值,连同误差的估计值 (见附录6.9或了解更多详情,卡洛什和惠特洛克,1986)。 对于反问题的解决方案采用蒙特卡罗方法是由开始 Keilis?Borok andYanovskava(1967)和出版社(1968,1971)。最近的
interestingworks是安德森和Seneta(1971,1972),罗斯曼(1985年,1985年b,
1986)和Dah1?Jensen的等(1998)。这本书,过参数,其中概率分布的透视 空间是核心,我们面临着如何使用它们的问题。对“中心估计”的定义(如均值或中位数)的“分散的估计”(如协方差和矩阵)缺乏通用性,因为它是很容易找到的例子(如多模态分布 在高维空间),其中这些估计不能有任何有趣的含义。 当一个概率分布已被定义在低维空间 (比方说,从一维到四维),我们可以直接表示关联概率密度。这是微不足道的一维或两维。它很容易在三维空间中,并且一些 花样可以允许我们表示了四维概率分布。此外, 事件A的概率可直接通过一个整体的,使用标准来评价 (非随机的)数值方法。 图2.1。的采样 ,概率密度使我们在计算中引入了概率理论(计算一个事件的概率使用估计某些时刻,等)简单的统计。
在模型空间中有很高的维数,代表一个概率密度是不可能的,但我么可以,至少在原则上,做些变换在很大程度是等价的。我们可以用 sample27概率密度,如图2.1中的建议。优先考虑一组概率分布的样本是单个“点”来表示,通常如图像,如2.2 (2.5右边的图像)。
对于高维空间问题很容易被低估,他们通常是趋于空的,图2.3表明,偶然触及的概率(最大值)超球面镌刻在超立方体迅速降低到零维空间的生长。当目标不是一个大领域,但一个小区域图2.3表明,偶然触及的概率(最大值)超球面镌刻在超立方体迅速降低到零维空间的生长。当目标不是一个大领域,但一个小区域
如图2.2,,9随机实现超过36的概率分布—三维空间。36值实际上是价值在6×6阵列,价值观是事实上的值在6-6矩阵,当值使用灰度等级表示,每个实现图像。请注意,大多数的图像提出了一个“十字”(突出)。同时,在下面的两行的像素,往往对应于较高的随机变量的值(灰色阴暗的等级)。给出了足够的样本,不同事件的概率可以被评估,例如,(i),希腊十字可能出现的概率,(ii)一个希腊十字架的概率图像的左边(通常是在右边),(iii)的概率有希腊十字,在同一时间,在图表的底部低值的变量,等
图2.3 , 高维空间往往是很空的。击球偶然的正方形的内切圆是很容易的。偶然的机会球内接打在一个立方体是一点点困难。当空间维度的增加,刻的超球面击中的概率在超立方体迅速趋向于零。在顶部,超球面的体积并给出了应用超立方体的一个函数维度的n,底部底部的体积比显示xplainswhy。这个数字解释了为什么探索随机在高维空间是很困难的,为什么要使用布朗运动解决随机探索。
n ?维数
2?2rn 立方体的超球面: 立方体的体积:(2r)n
n?(n)2 概率显示,它是很容易理解的,蒙特卡罗方法,可以用在高维空间是微不足道的。事实上,在一个大的三维空间中蒙特卡罗的抽样概率分布的两个问题:(i)定位的区域(S)的概率,和(ii)采样的整个区域(S)足够密度。寻找区域的位置是最困难的问题,数学是不能单独解决的(因为它大维空间大空):它是特定的物理(或结构)的,在一方面,可能有助于这一问题。一旦你已经能够接近一个这些地区,下面描述的技巧(吉布斯抽样和Metropolis算法)是能够执行一个随机变量,布朗运动的有效的探索区域,避免把它(从而进入空间的空旷地区)。
2.2电影策略的逆问题
在第一章我们看到逆命题的两个典型的输入一个是概率密度?M(m),描述了检验信息的模型参数,和一个概率密度?D(d),我们对参数信息进行描述,通过一些数据获得了, 逆问题的解决方案是由一个(后概率密度)概率密度
?M(m)等于(规范)先检验概率产品的密度, ?M(m)次一个似然函数L(m): ?M(m)?k?M(m)L(m). (2.1) 似然函数是衡量好模型m拟合数据。的可以编写规范不变 k?1?mdm?M(m)L(m)
在大多数集合中, 数据和模型参数之间的关系的概率并通过一个条件概率密代表?(dm)。然后,似函数(见方程(1.89)-(1.91)) L(m)??ddD?D(d)?(dm) (2.2)
?D(d)其中?D(d)是在该数据流形的均匀概率密度。
有时候,数据和模型参数之间是有关系的,d?g(m),这种情况下,似然函数(见方程(1.93)-(1.95))。
L(m)??D(g(m)) (2.3) 几个例子的似然函数给出footnote.28的方法对开发需要的值的计算可能在许多点,将可能性的表达形式(2.2)或(2.3)是不太相干的.
在这一章中,我们将介绍的方法,让我们先索取样品{M1,M2,...}的先验概
?,m2?,?}后验概率密度. ?M(m)因为,通常,每个率密度的?M(m),然后样品{m1样品(即,每个模型)可以被表示为一个图像,许多样品显示对应的显示“电影”。
让我们开始讨论“前代”电影。
显示(研究)的样本?M(m)让我们确认使用适当的先验信息。它可以帮助传达给别人哪一种先验信息我们已经记住(和也许允许这些人批评先验我们正试图用信息)。我们已经看到了三个样本的一个例子先验概率分布在例1.32,三个地球分层模型显示(图1.10,30页)。让我们看看另一个简单的例子。
(x)及其协 例2.1。 高斯随机场,高斯随机场的特点是它的平均场Mmean方差CM(X,X?)。考虑到这些,可以生成尽可能多的随机随机领域的实现一个可能希望(使用,例如,方法建议在下面示例2.2)。图2.4显示了三个随机的实现高斯随机场的零均值和球形covariance29(编码值颜色范围内)。给定一个足够大的数量的实现,意味着领域和协方差是容易估计(使用简单的统计数据),一个足够
大的号码实现完全是随机的。因为的协方差随机场是静止不动的,三张图片已经传达的一个好主意随机领域本身。需要更多的图片更一般的协方差。的显示这些样本的先验概率分布允许其他科学家评估的正确性先验信息被输入到反问题(实际(未知的)字段是一个随机实现这样一个随机领域)。显示平均协方差的高斯随机场和策划不是一个选择显示一定数量的实现,因为均值和协方差不相关一个直观的方式实
考虑到这些,可以生成尽可能多的随机随机领域的实现一个可能希望(使用,例如,方法建议在下面示例2.2)。图2.4显示了三个随机的实现高斯随机场的零均值和球形covariance29(编码值颜色范围内)。给定一个足够大的数量的实现,意味着字段和协方差是容易估计(使用简单的统计数据),一个足够大的号码实现完全是随机的。因为协方差随机场是静止不动的,三张图片已经传达的一个好主意随机领域本身。需要更多的图片更一般的协方差。显示这些样本的先验概率分布允许其他科学家评估的正确性先验信息被输入到反问题(实际(未知的)字段是一个随机实现这样一个随机领域)。显示平均协方差的高斯随机场和策划不是一个选
择显示一定数量的实现,因为均值和协方差不相关一个直观的方式实现.
图2.4。三个随机实现的二维高斯随机的字段。平均场是零,(静止)协方差之和白噪声加一个球形的协方差。(a·鲍彻,珀耳斯。通信).
当显示样本的先验概率密度的问题?M(m)被解决(已达成协议的存在和适用性先验信息),一个可能产生样本的后验概率密度?M(m)。生产的一般方法只对这些样本的后验分布介绍了下面的部分,但我们可以检查下面的一个非常简单的例子反问题,这些样本的生成可以通过使用一个简单的理论。
实例2.2。采样条件高斯随机领域。让我们简要探讨在这里,一个简单的逆问题,具有很高的教学价值。我们面对一个未知的二维领域被假定为一个随机的高斯随机领域实现了 2.1例(三随机字段的随机实现,在图2.4中显示的)。
图2.5。从一个随机的高斯随机字段中描述的实现在图2.4中,50的值显示在左上方被提取作为数据。的特定随-机实现,用于获取这些数据是我们未知的,