中国膳食暴露评估数学模型及模型改进的若干方法哈尔滨工业大学祝(4)

2018-12-25 23:17

4 风险评估模型的建立

4.1 风险评估概论

由于人们的饮食习惯不同,人们对各个地区的某类食品的需求不一样,所以在对某类食品作风险评估时,应在某个地区范围内进行调查,这样即使在人群食品模型中的调查对象和污染物分布模型中被调查食品的消费者不一样,具体影响不大。

风险分析是对所要进行的一些活动是否带有风险所进行的理论分析,它是科学决策中进行预防性管理的一种工具。风险评估是对与危害因素有关的风险进行评估分析的一项工作,可以分为定性风险评估和定量风险评估。

风险评估时需要了解以下几个方面的信息:危害鉴定;评估化学物的人体暴露(接触)量;危害和风险评估的剂量—效应特征;以及危险性特征。食品的风险主要来自两方面,一方面是食品中的某些化学物,另一方面是食品中生物性因素。为方便模型的讨论,这里主要涉及某些化学物的危害性。

危害鉴定,又称为对危害的认定和识别,属于定性危险性评估的范畴。危害鉴定的目的在于确定人体摄入化学物的潜在不良作用危害识别不是对暴露人群的危险性进行定量的外推,而是对暴露人群发生不良作用的可能性作定性的评价。危害鉴定的研究程序有流行病学研究、动物毒理学研究、体外实验以及定量结构—反应关系。在这一步骤不确定性包括危害因素的正确分类,即对人体健康是不是危害因素,和进行分类时测量的质量。如果某因素经过多次试验被认定为阳性或阴性,则具有一定的精度。 暴露评估主要是根据膳食调查和各种食品中化学物质暴露水平调查的数据进行的,通过计算得到人体对于该种化学物质的暴露量。目的在于求得某危害物的剂量、暴露频率、时间长短、途径及范围。来估计人群与界面外环境化学物的接触。剂量—效应关系的评估就是化学物的摄入量与不良健康效应的强度与频率。危险性特征的描述的结果是对人体摄入某化学物产生不良效应的可能性进行估计,它是危险鉴定、危害性特征描述和摄入量评估的综合结果。某一化学物如果存在阈值,则对人群危险性可以采用摄入量与ADI(可接受日摄入量)相比较的百分比作为危险性特征的描述,如果所评价的化学物的摄入量较ADI小,则对人的健康危害的可能性甚小。

食品安全状态是指食品中危害物的污染程度,这里将危害物的污染程度划分为高、中高、中、中低、低五档,从食品安全的角度看,危害物对食品的污染程度当然是越低越好。通过对大量食品中的危害物的检测数据进行统计及分析处理,从宏观上得到该食品被污染的程度,可以非常直观地说明该食品的安全状态。食品中的危害物存在着多样性以及各种毒物本身的毒性也有差异。危害物的多样性,除了食品中危害物数量众多外,还表现在其他两个方面:一方面不同食品所对应的危害物有较大差异;另一方面,即使同一类食品所检测的危害物在不同的时期有较大的差异。在研究食品安全状态时针对危害物本身的多样性,我们

15

将危害物分为农药残留、兽类残留、生物毒素、微生物、微量元素、真菌毒素、添加剂、有机污染物共8类。

目前在中国,食品安全的评估与预警还是一个全新的研究领域尚没有一套成熟的理论与技术。通常来讲,对一个状态对象进行检测和趋势分析,首先要研究分析该状态对象的综合评价问题。所谓评价是指将某一个或某一些特定对象的属性与一定的参考标准进行比较,从而得出其好坏优劣的评价。一般有两种评价“单一评价”和“综合评价”。单一评价是指评价标准比较单一明确的评价,主要用于某物质单一属性或成分的分析。反之,综合评价是指评价指标比较复杂的多指标评价。综合评价和单一评价的区别往往是相对的,因为综合指标的得到最终也要落实到对单个指标的高度集成。

风险评估是一个复杂的统计和计算过程,该过程可以细分为以下几个阶段:建立食品的评价指标体系;统计和计算各个指标的值;将指标值代入风险评估模型,确定食品的安全状况,如不安全,则采取风险管理措施。

在第一阶段中,选食品中各种危害物物的含量作为评价指标。在第二阶段中,在人群食物摄入量模型和污染物分布模型中,近似得出某一种食品各种危害物的量。在第三阶段中,以第二阶段中得到的数据作为模型的输入,来评估食品的安全性。

4.2 模型的建立和求解

20世纪90年代中期由Vapnik提出的基于统计学习理论的支持向量机方法是统计学习理论的结构风险最小化准则的具体实现,其基本思想是在样本空间或特征空间,构造出最优超平面,使得超平面不同类样本集之间的距离最大,从而达到最大的分类能力。从数学的描述角度,支持向量求解过程本质上是一个非负的的二次型优化问题,在理论上可以得到全局最优的解析解,因此支持向量机不存在局部最优问题。另外支持向量机的计算规模与样本数量有关,而与各个样本的维数无关,并且指标间的相关性对分类评价结果影响不大。支持向量机的这些特征表明支持向量机方法非常适合于食品安全多指标评价问题的研究。

下面介绍支持向量机基本方法。

设训练样本集{(xi,yi),i?1,2,???,l},由二个类别组成,如果xi?RN属于第1类,则标记为正(yi?1),如果属于第2类,则标记为负(yi??1)。学习的目标是构造一个判别函数,将测试数据尽可能正确地分类,下面针对训练样本集为线性、非线性两种情况进行分别讨论。 4.2.1 线性情况

如果存在分类超平面

16

wt?x?b?0 (14)

使得

wt?xi?b?1,yi?1?? ? 其中i?1,2,???,l (15) tw?xi?b??,yi??1??则称训练集是线性可分的,其中wt?x表示向量w?RN与x?RN的内积。式

(14)和式(15)中的w?RN,都进行了规范化,使得每类样本集中与分类超平面距离最近的点满足式(15)的等式要求。对于式(15),可以写成如下的形式

yi(wt?xi?b)?1

(16)

由统计学习理论知,如果训练样本集没有被超平面错误的分开,且超平面附近的样本数据与超平面之间的距离最大,则该超平面为最优超平面,由上得到的判别函数

y(x)?sign(wt?x?b) (17)

其泛化能力最优,其中sign(?)为符号函数。最优超平面的求解需要最大化

221,表示wt?xi?b?1与wt?xi?b??1之间的距离,即最小化||w||2,||w||||w||2所以得到如下的二次规划问题

min1?||w||2?w,b2?其中i?1,2,???,l (18) s.t.,yi(wt?xi?b)?1??当训练样本集为线性不可分时,需要引入非负松弛变量?i,分类超平面的最优化问题为:

????ts.t.,yi(w?xi?b)?1??i? (19)

??i?0,i?1,2,???,l???其中的C称为惩罚参数,C越大表示对错误分类的惩罚越大。采用拉格朗

日乘子法求解这个具有线性约束的二次规划问题,即

l12min||w||?C??iw,b,?2i?117

ll?12maxmin{Lp?||w||?C??i???i[yi(wt?xi?b)?1??i]}??,?w,b,?2? (20) i?1i?1?s..,t?i?0,?i?0?其中?i, ?i为拉格朗日乘子,由此得到

?Lp?w?0?w???iyixi (21)

i?1l?Lp?b?Lp??i?0???iyi?0 (22)

i?1l?0?C??i??i?0 (23)

将(21)~ (23)式代入式(20),得到对偶最优化问题

?1llmax{Lp???i????i?jyiyjxixj}??2i?1j?1i?1??s..,0t??i?C? (24)

?l??iyi?0??i?1?最优化求解得到的?i中,可能是:?i?0;0???C;?i?C,后两者所对应的

lxi称为支持向量(support vector,SV)。由式(21)知只有支持向量对w有贡献,也

就是对最优超平面、判别函数有贡献,支持向量正是由此而得名,对应的学习方

法称之为支持向量机。在支持向量中,?i?C所对应的xi称为边界支持向量(boundary support vector,BSV),实际上是错分的训练样本点,0??i?C所对应的xi称为标准支持向量(normal support vector,NSV)。根据条件Kuhn-Tucker条件,即在最优点,拉格朗日乘子与约束的积为0,即

?i[yi(wt?xi?b)?1??i]?0??? (25)

?i?i?0??对于标准支持向量(0??i?C),由式(23)得到?i?0,则由式(3-1-12)得到

?i?0,因此,对于任一标准支持向量,满足

yi(wt?xi?b)?1 (26)

从而可得参数b为

18

b?yi?wt?xi?yi?xj?SV??jyjxjxi,xi?NSV (27)

为了计算的可靠性,对所有的标准支持向量分别计算的值,然后求平均值,即

b?1NNSVxi?NSV?(yi?xj?SV??jyjxjxi) (28)

式中NNSV为标准支持向量数。 4.2.2

非线性情况

训练集数据为非线性时,通过非线性函数将训练集数据映射到一个高维线性特征空间,在这个维数可能为无穷大的线性空间中构造最优分类超平面,并得到分类器的判别函数。因此,在非线性情况下,分类超平面为:

wt?(x)?b?0 (29)

判别函数为

y(x)?sign[wt??(x)?b] (30)

最优分类超平面的问题描述为

????ts.t.,yi[w??(xi)?b]?1??i? (31)

??i?0???类似与线性情况,得到对偶最优化问题

l12min||w||?C??iw,b,?2i?1?1llmax{Lp???i????i?jyiyj?(xi)?(xi)??2i?1j?1i?1?l?1ll???i????i?jyiyjK(xi,xj)?2? (32) i?1i?1j?1?s.t.,0??i?C?l??iyi?0??i?1?其中K(xi,xj)??(xi)?(xi)称为核函数。

l19


中国膳食暴露评估数学模型及模型改进的若干方法哈尔滨工业大学祝(4).doc 将本文的Word文档下载到电脑 下载失败或者文档不完整,请联系客服人员解决!

下一篇:四则运算三c++ -

相关阅读
本类排行
× 注册会员免费下载(下载后可以自由复制和排版)

马上注册会员

注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: