python数据分析与挖掘实践—拉格朗日插值法
来源:互联网 发布:网络工程施工费用 编辑:程序博客网 时间:2024/06/05 16:11
缺失值处理:
举止,中位数,众数插补法
使用固定值(规定的标准值)
最近邻插补法
回归方法
插值法
插值法有拉格朗日差值和牛顿插值法。
一个较大的区别是,当节点增减的时候,拉格朗日插值必须重新计算,牛顿法则 可以避免这一点。
下面是python scipy中的lagrange插值函数的使用,使用某个插值点前后的5个值x=[0,1,2,3,4,6,7,8,9,10],y=[y0,y1,y2,y3,y4,y6,y7,y8,y9,y10]一共10个点,我们要求的是5对应的y5,这里的的参数为[a9...a0]一个10个值
对应的方程为
y=a9x^9+...+a1x+a0
我们带入要插值的数值x=5,一般为下标值
得出我们要求的5的插值y
#-*- coding:utf-8 -*-import pandas as pdfrom scipy.interpolate import lagrangeinputfile = 'catering_sale.xls'outputfile= 'sales.xls'data = pd.read_excel(inputfile)#读取exceldata[u'销量'][(data[u'销量']<400)|(data[u'销量']>5000)]=None#异常值变为空值def ployinterp_column(s,n,k=5):#默认是前后5个 #tem=list(range(n-k,n))+list(range(n+1,n+1+k)) y=s[list(range(n-k,n))+list(range(n+1,n+1+k))]#取数,n的前后5个,这里有可能取到不存在的下标,为空 y=y[y.notnull()]#如果y里面有空值的话就去掉 #teml=lagrange(y.index,list(y))#这里代表的就是参数ai return lagrange(y.index,list(y))(n)#最后的括号就是我们要插值的nfor i in data.columns: if i==u'日期': continue for j in range(len(data)): if(data[i].isnull())[j]:#空值进行插值 data[i][j] = ployinterp_column(data[i],j)data.to_excel(outputfile)
0 0
- 拉格朗日插值法《python数据分析与挖掘实践》
- python数据分析与挖掘实践—拉格朗日插值法
- Python数据挖掘入门与实践(一)——亲和性分析
- Python数据挖掘入门与实践(四)——亲和性分析
- Python数据分析与挖掘实战—挖掘建模
- python数据挖掘与分析实战—1、2、3
- 笔记《Python数据分析与实战挖掘》
- python数据分析与挖掘实战-4
- python 数据分析与挖掘实战
- Python数据分析与实战挖掘
- 【python】《Python数据挖掘入门与实践》实验环境搭建
- 数据专家最佳实践:数据挖掘与运维分析
- 数据特征分析---Python数据挖掘与分析
- 《python数据挖掘入门与实践》笔记1
- 《python数据挖掘入门与实践》笔记2
- 《python数据挖掘入门与实践》“电影推荐” 笔记3
- 基于R的数据挖掘方法与实践(3)——决策树分析
- Python数据挖掘入门与实践(二)——用scikit-learn估计器分类
- 【MPI学习4】MPI并行程序设计模式:非阻塞通信MPI程序设计
- 学习笔记3
- laravel学习笔记(5)— Blade模板引擎
- vimgrep 用法
- CSU
- python数据分析与挖掘实践—拉格朗日插值法
- POJ 2419 Forests
- 萌新瞎讲【分块】
- 【MPI学习5】MPI并行程序设计模式:组通信MPI程序设计
- Windows不能在本地计算机启动MongoDB,错误代码 100
- as 配置注释模板
- 四月英语——一个反复的日子
- 【MPI学习6】MPI并行程序设计模式:具有不连续数据发送的MPI程序设计
- POJ