时间序列分析——知乎话题讨论(收集)
来源:互联网 发布:淘宝网油福汽油 编辑:程序博客网 时间:2024/04/27 23:23
1)首先尽量简化数据,让每一个输入都有很规范的格式。每一个输入源必须是mean 0,variance 1。假如说不能直接用价格;要用价格的差距。这样才可以客观比较每个输入的作用。而且很多模型本来就有这个要求。
2)先排除那些没有用的输入。这很简单。把数据重新re-sample,得到两个对应的time series,A和B。算两个time series的correlation。当然这个值越大越好。但是还有更有用的技巧:给其中的一列A添加offset。试着用各个offset再得出correlation。你会发这个offset过小过大,correlation就越小了。但是中间有一个达到最高值的offset。那就是A领先与B的平均时间。这offset小于零,说明A可以预测B。大于零说明这数据根本没什么预测能力,反而B更能预测A。通过这个可以筛选掉好多东西。
3)现在你得到一套最具有预测能力的输入。但他们的weighting还不知道。首先肯定要去试着用最简单的linear model。如果你的linear model没用,那更高级的模型肯定也没用了,应该放弃。这linear算法的目标就是简单地得出一列weightings对吧。在某个时刻,这一列数字乘与‘现在’的value必须和未来的value有很大的correlation。所以选择一个心目中最合适的offset(假如一秒或一小时);然后直接算各个因素的correlation。拼成一列weightings。就这么简单。也可以试着不同offset,看看这模型最好能预算多久以后的value。这东西就叫linear regression。
4)在linear regression得到成果以后,再想象更复杂的模型。建议先从一个维度升级到两个维度。得到一个矩阵的weightings。说实话这应该已经够的了。不过如果必要追求再复杂一点的话,那真的建议decision tree。decision tree也可以理解成heirarchical model(层次模型?)。比如这个情况:你发现A或B越高能预测到C要涨,但好像A和B都太高的话,C反而要跌。所以必须有层次的。这decision tree里面最推荐用random forest。这样能够在复杂程度与预测准确度之间达到最平衡的效果。
5)再高级一点就是通过完全自由连接的graph,比如neural network。但是肯定先从简单的开始。如果直接用graph,因为connections太多太密集太复杂,很多循环之类的,导致人家很难以理解里面信息运转的道理。最好从linear到2D开始,这样每一步都更加理解数据之间的关系,更好去设计适合的结构。
6)其他的一些想法:不一定要只根据时间去预测。你所根据的时间线只需要是一个越来越大的某个东西。也可以是市场的买卖量之类的。因为买卖总量和时间一样的,只往前不往后。这样的话你不在预测多少时间以后的value而在预测多少买卖增加以后的value了。一般都比较合适。
还有一点就是:你的那个数据似乎是波浪类型的。这就没有符合第一点。应该转换成更基本的输入和输出;例如分成wavelength和amplitude两个预测对象。
- 时间序列分析——知乎话题讨论(收集)
- R语言实现LDA主题模型分析知乎话题
- 知乎2016年度赞同/收藏最多的回答 —— 编程话题
- scrapy抓取知乎话题v0.1
- 时间序列形态相似性分析(一)——时间序列形态相似性的度量
- pandas 时间序列分析(一)—— 基础
- Python数据分析基础(八)——时间序列
- SPSS应用——时间序列分析
- 时间序列分析——如何判断序列是否平稳
- 知乎spark与hadoop讨论
- 关于全栈的知乎讨论
- 时间序列分析(一)
- 话题讨论:做需求分析不要被表象迷惑
- [技术讨论]专业词汇需要严谨的分析——Serializable到底应该是串行还是序列
- 如何进入阿里巴巴,如何学好Java(转自:知乎话题“在阿里巴巴工作是怎样一番体验”)
- 收集一些知乎上好的帖子
- ML && DL 知乎问题收集
- 我想讨论的话题
- Spring MVC 中处理模型数据 (一)ModelAndView ModelMap @sessionAttributes
- linux用户与组
- Flume-安装Flume
- Wolfram希望提供“计算无处不在”的新的个人云服务
- MFC列表控件--List control
- 时间序列分析——知乎话题讨论(收集)
- 采用中序线索链表存储结构,实现中序遍历
- Git上传项目到GitHub上
- Androdi--RSA加密和服务器不一致
- 轻松把玩HttpClient之封装HttpClient工具类(九),添加多文件上传功能
- 小问题
- Maven私服Nexus,无法更新jar
- 大型网站系统架构演化之路
- NYOJ301-递推求值