华盛顿大学机器学习基础:案例研究week2

来源:互联网 发布:什么是网络电视机 编辑:程序博客网 时间:2024/05/16 05:18

利用Python学习简单的数据操作

import graphlabsales = graphlab.SFrame('home_data.gl/')#exploring the data for housing salesgraphlab.canvas.set_target('ipynb')sales.show(view="Scatter Plot",x="sqft_living",y="price")

这里写图片描述

#create a simple regression model of sqft_living to pricetrain_data,test_data = sales.random_split(.8,seed =0)#build the regression modelsqft_model = graphlab.linear_regression.create(train_data,target="price",features=['sqft_living'])

这里写图片描述

print(test_data['price'].mean())print(sqft_model.evaluate(test_data))

这里写图片描述

# let's show what our predictions look likeimport matplotlib.pyplot as plt%matplotlib inlineplt.plot(test_data['sqft_living'],test_data['price'],'.',       test_data['sqft_living'],sqft_model.predict(test_data),'-')

这里写图片描述

sqft_model.get('coefficients')

这里写图片描述

# explore other features in the datamy_features=['bedrooms','bathrooms','sqft_living','sqft_lot','floors','zipcode']sales[my_features].show()

这里写图片描述

sales.show(view='BoxWhisker Plot',x='zipcode',y='price')

这里写图片描述

# build a regression model with more featuresmy_features_model = graphlab.regression.create(train_data,target='price',features=my_features)

这里写图片描述

print(sqft_model.evaluate(test_data))print(my_features_model.evaluate(test_data))

这里写图片描述

# apply learned models to predict prices of 3 houseshouse1 = sales[sales['id']=='5309101200']

这里写图片描述

<img src="rich.jpeg">#这个语句要写在esc+M下才能出现图片

这里写图片描述

这里写图片描述

# prediction for a second, fancier househouse2 = sales[sales['id']=='1925069082']

这里写图片描述

原创粉丝点击