数据的n次拟合多项式
第一章 绪论
1.1课题国内外研究动态,课题研究背景及意义 1.2国内外的研究现状 1.3发展趋势
第二章 数据拟合的基本理论
2.1 最小二乘曲线拟合 2.2 线性拟合函数 2.3 二次拟合函数 2.4多项式拟合函数 2.5 小结
第三章 数据拟合的应用实例
3.1 数据拟合在物理实验中的应用 3.2 数据拟合在经济监控中的应用 3.3 模型评价
参考文献
附录
第一章 绪论
1.1 课题国内外研究动态,课题研究背景及意义
数学分有很多学科,而它主要的学科大致产生于商业计算的需要、了解数字间的关系、测量土地及预测天文事件。而在科技飞速发展的今天数学也早已成为众多研究的基础学科。尤其是在这个信息量巨大的时代,实际问题中得到的离散数据的处理也成为数学研究和应用领域中的重要的课题。
在解决实际工程问题和科学实验的过程中,经常需要通过研究某些变量之间的函数关系,帮我们去认识事物内在的规律和本质属性,这些变量间的未知的关系一般隐含在从观测、试验而得到的一组离散的数据之中。所以,是否能够根据一组试验观测数据来找到变量之间的相对准确的函数关系成为了解决工程实际问题的关键。
在实际问题中,通过观测数据能否正确揭示某些变量之间的关系,进而正确认识事物的内在规律与本质属性,往往取决于两方面因素。其一是观测数据的准确性或准确程度,这是因为在获取观测数据的过程中一般存在随机测量误差,导致所讨论的变量成为随机变量。其二是对观测数据处理方法的选择,即到底是采用插值方法还是用拟合方法[1-3],插值方法之中、拟合方法之中又选用哪一种插值或拟合技巧来处理观测数据。插值问题忽略了观测误差的影响,而拟合问题则考虑了观测误差的影响。但由于观测数据客观上总是存在观测误差,而拟合函数大多数情况下是通过经验公式获得的,因此要正确揭示事物的内在规律,往往需要对大量的观测数据进行分析,尤为重要的是进行统计分析。统计分析的方法有许多,如方差分析、回归分析等。数据拟合虽然较有效地克服了随机观测误差的影响,但从数理统计的角度看,根据一个样本计算出来的拟合函数(系数),只是拟合问题的一个点估计,还不能完全说明其整体性质。因此,还应该对拟合函数作区间估计或假设检验,如果置信区间太大或包含零点,则由计算得到的拟合函数系数的估计值就毫无意义。
所以,据科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数“最优的” 靠近那些数据点,按照误差最小的原则为最优标准来构造出函数。我们称这个函数为拟合函数。
现在,对数据点进行函数拟合以获得信息模型是许多工程应用领域的一个核
心问题。而为了适应这个多元化的世界中,为了能够满足各种各样的应用领域的要求,针对他们而对各种拟合方法的改进和研究也从未停止过。
1.1.1 国内外的研究现状
在通过对国内外有关的学术刊物(如《计算机科学》、《宇航学报》、《中原工学院学报》等)、国际国内有关学术会议和网站的论文进行分析。数据拟合的研究和应用主要是面对各种工程问题,有着系统的研究和很大的发展。通过研究发展使得数据拟合有着一定的理论研究基础。尤其是关于数据拟合基本的方法最小二乘法[4-9]的研究有着各种研究成果。
但是,由于现实问题的复杂性,数据拟合还拥有很好的研究空间,还有很多能够优化和创新的问题需要去研究和探索。各种算法的改进和应用以及如何得到合适的模型一直是一个比较热门的研究领域。
例如,国内外文献里提出了很多基于形状的描述方法,比如傅氏描述子法、多边形法、累积角法等, 其中以二次曲线和超二次曲线来拟合物体的边界形状并进行物体的描述已获得广泛应用。现在,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。应用高次隐式多项式曲线和曲面[10-15]为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。
所以说,在现在这个各个工程领域飞速发展的今天,数据拟合在实际应用与研究中仍然有着不小的发展空间
1.2 发展趋势
应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。
隐式多项式曲线的信息建模近年有了很大的发展。对隐式多项式曲线进行分析看出,MinMax算法十分精确地拟合了数据点的形状,并且非常的稳定,只需要对3L集合的权值参数调整问题做进一步的研究,MinMax等隐式多项式曲线的拟合算法抛弃了需要迭代的优化算法,只需要求解一个线性方程组就能够确定
隐式多项式曲线方程的系数,可以说已经趋于成熟。我们可以预见,把这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。
随着计算机的广泛应用,利用计算机相关软件解数据拟合问题也已经成为了不可缺少的步骤。
第二章 数据拟合的基本理论
科学和工程问题可以通过比如采样、实验等方法而得到若干的离散的数据,根据这些离散的数据,我们往往希望能得到一个连续函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合。这个过程叫做拟合。也就是说,如果数据不能满足某一个特定的函数的时候,而要求我们所要求的逼近函数最优的靠近那些数据点,按照误差最小的原则为最优的标准来构造出函数。
在科学计算中经常要建立实验数据的数学模型。给定函数的实验数据,需要用比较简单和合适的函数来逼近(或拟合)实验数据。这种逼近的特点是:
(1) 是需要适度的精度的; (2) 实验数据有一些小的误差;
(3) 对于一些问题,可能有一些特殊的信息能够用来选择实验数据的数学模型。
逼近离散数据的基本方法就是曲线拟合,常采用最小二乘拟合。
曲线拟合问题的数学描述是,已知一组(二维)数据(xi,yi),i = 1,2,…,n(即平面上的n个点(xi,yi),i = 1,2,…,n),xi互不相同,寻找一个函数(曲线)y = f(x),使得f(x)在某种准则下与所有的数据点最接近,即曲线拟合得最好。
2.1 最小二乘法的基本原理?
从整体上考虑近似函数p(x)同所给数据点(xi,yi)(i=0,1,?,m)误差
ri?p(xi)?yiri?p(xi)?yi(i=0,1,?,m)?的大小,常用的方法有以下三种:一是误差(i=0,1,?,m)绝对值的最大值0?i?mTmaxri,即误差 向量
mr?(r0,r1,?rm)的∞—范数;二是误差绝对值的和i?0m?ri,即误差向量r的1—
范数;三是误差平方和i?0?r2i的算术平方根,即误差向量r的2—范数;前两种
方法简单、自然,但不便于微分运算 ,后一种方法相当于考虑 2—范数的平方,
m因此在曲线拟合中常采用误差平方和i?0体大小。?
?r2i来 度量误差ri(i=0,1,?,m)的整
数据拟合的具体作法是:对给定数据 (xi,yi) (i=0,1,?,m),在取定的函数类?中,求p(x)??,使误差ri?p(xi)?yi(i=0,1,?,m)的平方和最小,即
m i?0?r2i??p(x i?0mi)?yi??min2
从几何意义上讲,就是寻求与给定点(xi,yi)(i=0,1,?,m)的距离平方和为最小的曲线?y?p(x)(图6-1)。函数p(x)称为拟合函数或最小二乘解,求拟合函数p(x)的方法称为曲线拟合的最小二乘法。 ?在曲线拟合中,函数类?可有不同的选取方法.
6—1
2.2线性拟合函数原理
给定一组数据,做拟合直线,均方误差为
(6.2)
是二元函数,的极小值要满足