【Deep Learning】Using Structured Events to Predict Stock Price Movement:An Empirical Investigation

来源:互联网 发布:java常用设计模式详解 编辑:程序博客网 时间:2024/06/06 12:22
时间:2014
发表于:EMNLP
原文件:http://pan.baidu.com/s/1i3phG49

主要内容:
利用新闻事件来预测:1. 美股大盘走势;2. 挑选的15个个股的走势。

详细内容:
主要工作步骤:
1. 抽取财经新闻
2. 对新闻title进行parser,并进行事件抽取。
其中事件抽取是open information extraction,即不限定事件的模版,而是进行开放式抽取。抽取的结果是:(主语、动词、宾语、时间)。其中,各个元素都会做stemming,动词会做聚类、变成动词类别,如:get_class这个类别。
3. 对抽取的结果进行泛化,如:将(主语、动词、宾语、时间)泛化成几个输入,(主语、动词)、(动词、宾语)等等,从而避免原始输入的数据稀疏问题。
4. 将上述输入给到分类模型,如:svm、或者deep learning,进行二值分类,从而预测大盘和单只股票的涨跌

实验:
在美股上做的,用了Reuters和Bloomberg的财经频道的新闻,分别预测大盘以及个股的下一天、下一周、下一个月的涨跌。对比baseline是仅仅采用词袋输入特征的模型(svm或者deep learning)

实验结果:
1. 预测一天的准确率要高于预测的时间长的,说明事件对于短期的股票预测作用比较大
2. title数据最有用,加入了content数据、反而预测准确率下降了
3. deep learning比svm有用,不过隐层2层效果最好,3层就不好了,没有尝试更多层

相关工作:
1. 之前的人是采用词袋特征+分类器来进行预测的
2. 在词袋特征的基础上,一种扩展方法是加入短语特征,如:名词性短语
3. 在词袋特征的基础上,另一种扩展方法是加入语义特征,如:通过广大用户在twitter上的情绪指数来预测大盘走势

0 0
原创粉丝点击