kaggle——Bike Sharing Demand
来源:互联网 发布:python 异或运算符 编辑:程序博客网 时间:2024/05/16 05:29
个人感觉最主要是通过visualization来获取一些信息,
在这之前一般都要先提取出一些有用的feature,比如这里的时间字符串要先提取出“小时”这个信息
有时在丢到model之前需要extract一些feature,也需要drop一些没用的feature
比如24小时变化的曲线
工作日24h变话的曲线(想想也是对的,大部分是在上下班的时间)
周末24h变换的曲线
从中就可以挖掘出一些有用的信息
挖掘出来最简单的应用就是根据时间来预测,用当前时间段的所有的平均值代替就行了,
但是这样做出来的结果是比较差的,还不如直接用random forest来的LB效果好(话说kaggle里面好像特别favor RF,是分类,回归问题大家都喜欢用)
也许应该对不同的时间进行预测?但是这样样本量就减小了24倍,值得一试
有人也说:
1. 按照是否注册分别预测,因为从24h图上看他们的趋势是不一样的,
2. instead of predicting count, but predict ln(count+1), because evaluation is RMSLE
但是我写的对比,答案差不多
阅读全文
0 0
- kaggle——Bike Sharing Demand
- Bike Sharing Demand (Kaggle)
- 【Kaggle笔记】Bike Sharing Demand
- kaggle 入门 Bike sharing Demand prediction
- kaggle入门-Bike Sharing Demand自行车需求预测
- Kaggle (Bike Sharing Demand)top20%
- Forecasting Bike Sharing Demand
- Bike-sharing-demand
- Kaggle Bike Sharing项目报告
- kaggle bike sharing program R code tranlated from python code ranked 9th
- Kaggle之Grupo Bimbo Inventory Demand
- Bike Rental Demand Estimation with Microsoft R Server
- kaggle——Titanic
- Sharing Memory—Automatically
- zoj 3854——Travel by Bike
- kaggle——Digit Recognizer
- Kaggle—Digit Recognizer竞赛
- 1018. Public Bike Management (27分)——深搜
- 用于处理JDBC 增删等写操作的事务控制
- Broken Keyboard (a.k.a. Beiju Text)
- 2017.8.15 总结
- tp5模型belongsTo和hasOne的区别
- Flask-响应、调度方法和蓝图
- kaggle——Bike Sharing Demand
- 8.15 找礼物 2697
- java操作Excel表
- 2017 Multi-University Training Contest
- 考题3
- 支持向量机通俗导论(理解SVM的三层境界)
- spark学习- SparkSQL--08-org.apache.spark.SparkException: A master URL must be set in your config
- 0040_Combination Sum II
- 2188. 猴子上树