机器学习实用案例解析--读书笔记

来源:互联网 发布:罗斯玛丽的婴儿知乎 编辑:程序博客网 时间:2024/04/30 03:45

第五章 线性回归

  • 对于一个给定的数据集,我们想用线性回归来进行预测
    fitted.regression <- lm(y~x,datasource)

  • 接下来要进行直线的位置参数的求解
    [intercept slope] = ceof(fitted.regression)

  • 求解出直线以后,要对我们求出的直线进行评估,主要通过残差平方和
    errors <- residuals(fitted.regression)
    squred.errors <- errors ^ 2

  • 但是残差平方和会受到数据集大小的影响,所以使用残差平方和的均值MSE
    mse <- mean(squared.errors)

  • 然而平均偏离量较大时,还是会把这种偏离的影响扩大,因为是先求了平方再求得均值,所以用均方误差 RSME
    rsme <- sqrt(mse)

  • 但是我们没有一个标准说RSME到多大是不好的,所以我们R^2来解决
    r2 <- 1- (model.rmse/mean.rmse)

0 0