【笔记】AI100-Kaggle竞赛_2017年房价预测
来源:互联网 发布:公司屏蔽了淘宝怎么办 编辑:程序博客网 时间:2024/05/20 14:22
案例来源:https://mp.weixin.qq.com/s?__biz=MzI0ODcxODk5OA==&mid=2247483916&idx=1&sn=a83de5391530049632ba2a0ef4d6a60b @AI100
(以下为阅读笔记,目的是便于之后能快速检索到相关内容。部分文字与图片可能直接来自原文,如有侵权请告知,谢谢)
1. 数据:kaggle比赛提供的描述洛瓦(Lowa)住房方方面面的特征总共有79个
2. 目标:预测亚美尼亚州洛瓦市(Ames,Lowa)的房价
3. 探索性数据分析
- 绘制各个特征的直方图,了解哪些可能是异常值。
- 基于直方图,初步了解哪些特征有效
- 由于是回归问题,多重共线性会影响预测效果。计算特征间的相关系数,找出具有较高相关性的特征
4. 特征工程
- 房屋到街道的直线距离。将房屋分组(分组依据?),组内使用中位数来填充NA
- 对于连续特征,为了使其满足线性回归所需要的线性特征、恒等方差以及正态性等,使用log(x+1)进行特征转化
- 对于一部分特征,采用“差、中等、好”来简化
5. 模型融合
- sensemble:训练xgb、lasso、ridge模型,等权重平均
- stacking:以xgb、lasso、random forest、gbm模型的输出作为新特征,以xgb作为分类器训练
阅读全文
0 0
- 【笔记】AI100-Kaggle竞赛_2017年房价预测
- kaggle 房价预测经典文章
- Kaggle房价预测案例分享
- Kaggle入门实例-预测房价
- Story 2---Kaggle房价预测
- Kaggle房价预测:随机森林方法
- kaggle房价预测/Ridge/RandomForest/cross_validation
- 笔记-Kaggle竞赛入门
- Kaggle房价预测进阶版/bagging/boosting/AdaBoost/XGBoost
- Kaggle房价预测:数据探索——练习
- Kaggle房价预测:数据预处理——练习
- AI100
- [kaggle竞赛实践] Titanic幸存预测问题--logistic回归解决方案
- kaggle竞赛入门:titanic数据预测学习(翻译)
- Kaggle竞赛之-titanic学习笔记
- kaggle竞赛学习笔记:EDA 和 preprocessing
- 2015年房价走势预测:中国房价迈向分水岭
- 【Kaggle笔记】预测泰坦尼克号乘客生还情况(决策树)
- 动画
- HDOJ 1013 Digital Roots
- 双非渣硕的算法求职路
- win 服务器迁移 ubuntu
- 新手上路之plsqldev(oracle)个人喜欢的背景色图文配置
- 【笔记】AI100-Kaggle竞赛_2017年房价预测
- Ajax上传文件(JQuery篇)
- leetcode 3. Longest Substring Without Repeating Characters
- map常用操作——添入、删除、查找、遍历
- python处理csv文件
- 条件化的Bean——@Conditional注解
- springboot访问jsp页面
- 树链剖分+线段树 POJ3237 权值在边 模板
- oracle rac增加节点报错三例