李航《统计学习方法》多项式函数拟合问题V2

来源:互联网 发布:vscode eslint format 编辑:程序博客网 时间:2024/06/06 00:44

问题描述

假定给定一个训练数据集: 

T={(x1,y1),(x2,y2),,(xN,yN)}

其中,xiR是输入x的观测值,yiR是相应的输出y的观测值,i=1,2,,N,多项式函数拟合的任务是假设给定数据由M次多项式函数生成,选择最有可能产生这些数据的M次多项式函数,即在M次多项式函数中选择一个对已知数据以及未知数据都有很好预测能力的函数。

M次多项式为

fM(x,w)=w0+w1x+w2x2++wMxM=j=0Mwjxj

式中x式单变量输入,w0,w1,,wmM+1个参数。

用平方损失作为损失函数,系数12是为了方便计算,将模型与训练数据代入,有 

L(w)=12i=1N(j=0Mwjxjiyi)2

wj求偏导并令其为0

书里这里的求导是错误的,就不写错误的推导了,下面给出正确的推导

set L(w)wk=012i=1N2(j=0Mwjxjiyi)×xki=0i=1Nj=0Mwjxjii=1Nxkiyi(k=0,1,2,,M)

所以要求拟合多项式系数w0,w1,,wM需要解下面这个线性方程组,下面的求和符号上下限都是i=1N,为了方便略去不写。

Nxix2ixMixix2ix3ixM+1ix2ix3ix4ixM+2ixMixM+1ixM+2ix2Miw0w1w2wm=yixiyix2iyixMiyi

所以计算出i=1Nxji(j=0,1,2,,2M)i=1Nxjiyi(j=0,1,2,,M)然后将这些值带入上述线性方程组求解即可。

下面给出python实现

# coding=utf-8'''作者:Xiaole Wen程序:多项式曲线拟合算法'''import matplotlib.pyplot as pltimport mathimport numpyimport randomfig = plt.figure()ax = fig.add_subplot(111)#在这里给出拟合多项式的阶数order=9#生成曲线上的各个点x = numpy.arange(-1,1,0.02)y = [((a*a-1)*(a*a-1)*(a*a-1)+0.5)*numpy.sin(a*2) for a in x]#ax.plot(x,y,color='r',linestyle='-',marker='')#,label="(a*a-1)*(a*a-1)*(a*a-1)+0.5"plt.plot(x,y)#生成的曲线上的各个点偏移一下,并放入到xa,ya中去i=0xa=[]ya=[]for xx in x:    yy=y[i]    d=float(random.randint(60,140))/100    #ax.plot([xx*d],[yy*d],color='m',linestyle='',marker='.')    i+=1    xa.append(xx*d)    ya.append(yy*d)ax.plot(xa,ya,color='m',linestyle='',marker='.')#存储从0次到m次的所有冥方和bigMat=[]for j in range(0,2*order+1):    sum=0    for i in range(0,len(xa)):        sum+=(xa[i]**j)    bigMat.append(sum)#计算线性方程组系数矩阵matA=[]for rowNum in range(0,order+1):    row=bigMat[rowNum:rowNum+order+1]    matA.append(row)matA=numpy.array(matA)matB=[]for i in range(0,order+1):    ty=0.0    for k in range(0,len(xa)):        ty+=ya[k]*(xa[k]**i)    matB.append(ty)matB=numpy.array(matB)matAA=numpy.linalg.solve(matA,matB)#画出拟合后的曲线#print(matAA)xxa= numpy.arange(-1,1.06,0.01)yya=[]for i in range(0,len(xxa)):    yy=0.0    for j in range(0,order+1):        dy=(xxa[i]**j)        dy*=matAA[j]        yy+=dy    yya.append(yy)ax.plot(xxa,yya,color='g',linestyle='-',marker='')ax.legend()plt.show()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80
  • 81
  • 82
  • 83

下面给出阶叔分别取3和取9的时候的拟合结果

图中蓝色的线代表原始数据生成函数,绿色代表拟合函数

这里写图片描述 
这里写图片描述

原创粉丝点击