第1章 绪论
界形状并进行物体的描述已获得广泛应用。现在,我们应用高次隐式多项式曲线来作为物体的几何模型受到广泛的重视。应用高次隐式多项式曲线和曲面[10-15]为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。
所以说,在现在这个各个工程领域飞速发展的今天,数据拟合在实际应用与研究中仍然有着不小的发展空间。
1.1.2 课题研究的意义
归纳总结数据拟合理论在工程中实际应用,发掘各个数据拟合算法的在实际应用中的应用范围适用性。通过对本项目的研究和分析,使得实际中的工程问题根据不同的需求使用最合适的拟合算法,从而提高拟合的精确度。
研究和发展数据拟合理论,发掘各种数据拟合的优化方案。
根据离散的数据,我们想要得到连续的函数或更加密集的离散方程与已知数据相吻合。如何选择数学模型,如何减小误差,如何使得逼近函数图像最靠近那些数据点,使得优化拟合算法变得十分重要。
1.2 研究主要成果
作为数据拟合的最基本也是应用最广泛的方法,最小二乘法有了很大的发展。在工程实际应用和实验中,我们经常采用实验的方法寻找变量间的相互关系。但是,当观测到的数据较多时,一般情况下使用插值多项式来求近似函数是不现实的。根据多元函数线性回归理论,使用曲线拟合最小二乘法来寻求变量之间的函数关系能够很好的解决这个问题。而且我们对它在实际应用中产生各方面的需求有着各种研究。例如:基于于均差最小二乘拟合方程形式的研究、数据拟合函数的最小二乘积分法、非线性最小二乘法等各种方法已经在工程中得到了应用。
所谓数据拟合的最小二乘法(generalized least squares)是一种数学优化
3
燕山大学本科生毕业设计(论文)
的技术,它通过最小化误差的平方和寻找数据的最佳函数匹配,并使得这些求得的数据与实际数据之间误差(残差)的平方和为最小。为了使问题的提法更具有一般性,通常把最小二乘法中的误差(残差)平方和都考虑为加权平方和。最后为了使误差的加权平方和最小,会转化为求多元函数的极小点的问题。其有关概念与方法可以推广到多元函数拟合之中。
最小二乘法在运筹学、统计学、逼近论和控制论中,是很重要的求解方法。例如,它在统计学之中是估计回归参数最基本的方法。
但是关于最小二乘法的发明权,我们在数学史的研究中还没有定论。有些材料表明了高斯和勒让德分别独立提出这种方法。资料表明勒让德在1805年首次公开发表了关于最小二乘法的论文。这时,高斯指出,他早在1795年之前就使用了这一种方法。可是数学史的研究者们只找到了关于高斯约在1803年之前使用了这一种方法的证据。
最小二乘法历史简介:
1801年,意大利的天文学家朱赛普·皮亚齐发现了第一颗小行星(谷神星)。但是经过了40天的跟踪观测之后,因为谷神星运行至太阳的背后,使得朱赛普·皮亚齐失去这颗小行星的位置。在这之后全世界的科学家都开始利用皮亚齐观测的数据开始寻找这颗小行星,但是根据大多数科学家计算的结果,都没有找到谷神星。当时,24岁的高斯也用相关数据计算了谷神星的轨道。奥地利天文学家海因里希·奥尔伯斯根据高斯所计算出的轨道重新发现了谷神星。
高斯所使用的最小二乘法的方法在1809年发表于他的著作《天体运动论》中。
法国科学家勒让德在1806年独立发现了“最小二乘法”。但是因为不为时人所知而默默无闻。
勒让德曾与高斯为“是谁最早创立了最小二乘法原理”而发生争执。 在1829年,高斯给出了最小二乘法优化效果强于其他方法的证明,被称为高斯-马尔科夫定理。
高斯-马尔科夫定理:在给定经典线性回归模型的假定下,最小二乘估计量,在无偏线性估计一类中,有最小方差,就是说,它们是
4
第1章 绪论
BLUE(best linear unbiased estimator),即最佳线性无偏估计。
在实际工程问题中,如何由测量的离散数据设计和确定最优的拟合曲线?其关键在于选择适当类型的拟合曲线,一些时候根据专业的知识和我们的经验就可以确定拟合曲线类型;但是当我们在对拟合曲线一无所知的情况下,可以先绘制离散数据的粗略图形,也许能够从中观测出拟合曲线的类型;或者对数据进行多种可能较好的曲线类型的拟合,并且计算出它们的均方误差,利用数学实验的方法找出最小二乘法意义下误差最小的拟合函数。
例如最简单的一次函数y=kx+b,已知坐标轴上有一些点(1.2,2.0),(2.1,3.2),(3.0,3.9),(4.0,6.1),(5.2,6.1),求过这些点的图象的一次函数关系式。一般情况下这条直线不可能恰好经过每一个点,所以我们只要做到这5个点到所求的直线的距离的平方和最小就可以了,这里就需要用到最小二乘法的基本思想.然后就利用线性拟合的方法来求直线。一般只用于建模。
在离散数据的最小二乘法中,最简单、最常用的数学模型是多项式拟合。 另外,近年来对高次隐式多项式曲线来作为物体的几何模型也受到广泛的重视,用隐式多项式曲线来描述数据点集合的轮廓也有了初步的比较系统的研究。
随着数据拟合的广泛应用出现了许多可以进行拟合的应用软件[16]。OriginPro,Matlab,SAS,SPSS,DataFit,GraphPad,TableCurve2D,TableCurve3D,Mathematica等其功能都十分优秀。他们还具有自动选择数学模型的功能。
1.3 发展趋势
应用高次隐式多项式曲线和曲面为各个领域的数据进行可视化建模还没有广泛的研究。用隐式多项式曲线来描述数据点集合的轮廓有天然的优势,在数据点集合轮廓的拟合过程中,为业务信息建模所具有的优点,其它建模方法根本无法比拟,这主要是因为隐式多项式曲线有着精确的表达能力,隐式多项式曲线的参数完全取决于它的次数和系数,解析式明确,操纵和使用方便,它还具有着天然的数据噪声过滤能力和修补能力。
隐式多项式曲线的信息建模近年有了很大的发展。对隐式多项式曲线进行分析看出,MinMax算法十分精确地拟合了数据点的形状,并且非常的稳
5
燕山大学本科生毕业设计(论文)
定,只需要对3L集合的权值参数调整问题做进一步的研究,MinMax等隐式多项式曲线的拟合算法抛弃了需要迭代的优化算法,只需要求解一个线性方程组就能够确定隐式多项式曲线方程的系数,可以说已经趋于成熟。我们可以预见,把这种建模思想应用到各种数据点集合之中必将带来很大的发展空间。
随着计算机的广泛应用,利用计算机相关软件解数据拟合问题也已经成为了不可缺少的步骤。
1.4 研究的基本内容
数据拟合理论体系的研究:研究数据拟合的基本理论,了解并掌握数据拟合的基本理论和方法。通过阅读参考文献和有关资料,学习数据拟合的重要意义以及目前关于数据拟合问题的研究现状。并对目前数据拟合的各种方法的特点做出概述。
(1)处理两个变量之间关系的曲线拟合基本理论,并对其方法进行分析。 (2)多元函数拟合的基本理论,并对其方法进行分析。
数据拟合在工程实际中应用实例的研究:归纳总结数据拟合理论在工程中实际应用的典型实例。通过分析实际的工程应用实例的有关资料,掌握数据拟合在实际工程中的应用方式。对其进行分析,研究数据拟合在实例应用中的合理性和可行性。研究各种方法在理论与实例应用之间的关系。研究数据拟合在实例应中的灵活行。
(1)曲线拟合在工程实际中的应用实例,并对其特点进行分析和总结。 (2)多元函数拟合在工程实际中的应用实例,并对其特点进行分析和总结。
1.5 论文的主要工作及结构安排
由上可知,论文将从数据拟合发展过程、特点、基本方法以及数据拟合在工程实际中的应用实例对数据拟合进行全面、深入地研究,在此基础上,归纳总结数据拟合在工程问题中的各种应用,并对其进行理论分析。
具体内容安排如下:
(1)第2章主要从理论的角度研究数据拟合的基本思想,方法。分别从
6
第1章 绪论
处理两个变量之间关系的曲线拟合基本理论和多元函数拟合的基本理论两个大的方面进行研究细分。
(2)第3章主要通过工程实际中的应用实例,利用数据拟合的基本理论也分别从曲线拟合在工程实际中的应用实例和多元函数拟合在工程实际中的应用实例进行归纳并进行分析。
7