第三章 数据拟合
知识点:曲线拟合概念,最小二乘法。
1.背景
已知一些离散点值时,可以通过构造插值函数来近似描述这些离散点的运动规律或表现这些点的隐藏函数
观测到的数据信息 • • • • • • • • 插值:插值函数x) • • • • • •
曲线拟合方法也可以实现这个目标,不同的是构造拟合函数。两种方法的一个重要区别是:由插值方法构造的插值函数必须经过所有给定离散点,而曲线拟合方法则没有这个要求,只要求拟合函数(曲线)能“最好”靠近这些离散点就好。
2.曲线拟合概念
实践活动中,若能观测到函数y=f(x)的一组离散的实验数据(样点):(xi,yi),
• • 拟合:拟合函数x) • • • • • i=1,2…,n。就可以采用插值的方法构造一个插值函数x),用x)逼近f(x)。插值方法要求满足插值原则xi)=yi,蕴涵插值函数必须通过所有样点。另外一个解决
《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版 第三章数据拟合 2h 1
2012~ 2013学年第 2学期 计算方法 教案 计1101/02,1181 开课时间:2012-02
逼近问题的方法是考虑构造一个函数x)最优靠近样点,而不必通过所有样点。如图。
-4
y=x)
• xi)
4
•
yi=f(xi) •
2
• • 2
•
•
4 样点
•
-2
即向量T=(x1),x2),…xn))与Y=(y1,y2,。。。,yn)的某种误差达到最小。按T和Y之间误差最小的原则作为标准构造的逼近函数称拟合函数。
曲线拟合问题:如何为f(x)找到一个既简单又合理的逼近函数x)。
曲线拟合:构造近似函数x),在包含全部基节点xi(i=1,2…,n)的区间上能“最好”逼近f(x)(不必满足插值原则)。 逼近/近似函数y=x)称经验公式或拟合函数/曲线。
拟合法则:根据数据点或样点(xi,yi),i=1,2…,n,构造出一条反映这些给定数据一般变化趋势的逼近函数y=x),不要求曲线x)经过所有样点,但要求曲线x)尽可能靠近这些样点,即各点误差δi=xi)-yi按某种标准达到最小。 均方误差/误差平方和/误差的2-范数平方:
||||i2
22i1n常用误差的2-范数平方作为总体误差的度量,以误差平方和达到最小作为最优标准构造拟合曲线的方法称为曲线拟合的最小二乘法(最小二乘原理)。
3.多项式拟合
《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版 第三章数据拟合 2h 2
2012~ 2013学年第 2学期 计算方法 教案 计1101/02,1181 开课时间:2012-02
(1)线性拟合
给定一组(xi,yi),i=1,2…,n。构造线性拟合函数p1(x)=a+bx,使均方差
||||(p1(xi)yi)(abxiyi)2F(a,b)
222i2i1i1i1nnn
达到最小。即如何选择a、b使F(a,b)达到最小?考虑多元函数极小值问题:整理得
nF(a,b)2(abxiyi)0 ai1nF(a,b)2(abxiyi)xi0 bi1nnxii1nxiyiai1i1 nnbxi2xiyii1i1n
此式称为拟合曲线的法方程组或正则方程组。用消元法或克莱姆法则求解方程组得
a(yixxixiyi)/(nx(xi)2)
2i2ii1i1i1i1i1i1nnnnnn
b(nxiyixiyi)/(nxi2(xi)2)
i1i1i1i1i1nnnnn
这就是均方误差意义下的拟合函数p1(x)。例子见P49。 (2)二次拟合(选)
给定一组(xi,yi),i=1,2…,n。用二次多项式拟合这组数据。设
p2(x)=a 0+a 1x+ a2x2,作出拟合函数与数据序列的均方误差: 其中
F(a0,a1,a2)(p2(xi)yi)(a0a1xia2xi2yi)2
2i1i1nn||||i2
22i1n类似线性拟合,根据最小二乘和极值原理:
nF2(a0a1xia2xi2yi)0a0i1
nF2(a0a1xia2xi2yi)xi0 a1《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版 第三章数据拟合 2h i1nF2(a0a1xia2xi2yi)xi20a2i13
2012~ 2013学年第 2学期 计算方法 教案 计1101/02,1181 开课时间:2012-02
整理得到二次多项式函数拟合的法方程:
解法方程,便得到均方误差意义下的拟合函数p2(x)。
不过当多项式的阶数n>5时,法方程的系数矩阵病态。计算中要用双精度或一些特殊算法以保护解得准确性。
(3)一般情况(类似线性拟合处理,从略)
nnxi1inx2ii1xxi1ni1i1nni2ixi3nxyii1a0i1nn3xaxyi1ii i11a2inn42xixiyii1i12in4.例(从略)
用二次多项式拟合如下一组数据 X Y -3 4 -2 2 -1 3 0 0 1 -1 2 -2 3 -5 解
设p2(x)= a 0+ a 1x+ a 2x²,经计算得
X -3 -2 -1 0 1 2 y 4 2 3 0 -1 -2 xy -12 -4 -3 0 -1 -4 x² 9 4 1 0 1 4 x ² y 36 8 3 0 -1 -8 x³ -27 -8 -1 0 1 8 x⁴ 81 16 1 0 1 16 《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版 第三章数据拟合 2h 4
2012~ 2013学年第 2学期 计算方法 教案 计1101/02,1181 开课时间:2012-02
3 ∑0 -5 1 -15 -39 9 28 -45 -7 27 0 81 196
相应的法方程为:
《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版第三章数据拟合 2h 5
2012~ 2013学年第 2学期 计算方法 教案 计1101/02,1181 开课时间:2012-02
7 a 0 +0 a 1 +28 a 2=1 0 a 0 +28 a 1 +0 a 2=-39 28 a 0 +0 a 1 +196 a 2=-7 解方程得:
a 0= 0.66667,a 1=-1.39286, a 2=-0.13095。 所以p2(x)= 0.66667-1.39286x-0.13095x2 拟合曲线均方误差:
||||(p2(xi)y2)23.09524
222ii1i177
如何根据测量的数据设计和确定“最贴近”的拟合曲线?关键在于找到适当的拟合曲线类型,可以根据专业知识和工作经验确定拟合曲线类型。如果对拟合曲线一无所知,可以先绘制数据略图,可能从中观测出拟合曲线类型。一般情况下,应对数据进行多种曲线类型拟合,计算均方误差,用数学实验的方法找出最小二乘法意义下的误差最小的拟合函数。
《计算方法引论》、徐翠薇,高等教育出版社 2008年4月第三版 第三章数据拟合 2h 6
因篇幅问题不能全部显示,请点此查看更多更全内容