线性回归-实践篇

来源:互联网 发布:阿里云学生服务器购买 编辑:程序博客网 时间:2024/05/17 02:03

总结了线性回归的理论部分,下面我们以浦东塘桥的二手房数据来实践线性回归。

数据及代码连接下载,工具使用Octave。

1,数据获取

从网站爬到数据,并整理成我们需要的。爬取方式不便多讲,本人是用的jsoup。

2,数据过滤

爬到数据后,过滤了房间面积小于30平米,大于150平米的数据,总价格大于800w的也过滤了。(这些数据太小或者太大)

3,一元线性回归

x表示房子面积,y表示房价,使用正规方程组的方法计算。

拿到代码后执行one即可。

执行结果如下:




4,多元线性回归

x表示房子面积、房间数、楼层,y表示房价,使用正规方程组的方法计算。

拿到代码后执行multi即可。

执行结果如下:


% 加载数据data = load('house.txt');% 定义 x 和 yx = data(:,1);y = data(:,4);% 绘制数据函数function plotData(x,y)plot(x,y,'rx','MarkerSize',8); % Plot the dataend% 绘制数据plotData(x,y);xlabel('Square Feet'); % 设置X轴标签ylabel('Price'); % 设置Y轴标签% 数据大小m = length(x);% 加一列到x向量X = [ones(m, 1) x];% 计算thetatheta = (pinv(X'*X))*X'*y% 绘制拟合的直线hold on; % 使之前数据可见plot(X(:,2), X*theta, '-')legend('Training data', 'Linear regression')hold off % 结束绘制price = [1, 80] * theta; fprintf(['Predicted price of a 80 sq-ft(using normal equations):\n %f\n'], price);



0 0
原创粉丝点击