自然语言处理——数据集

来源:互联网 发布:比特币算法为谁服务 编辑:程序博客网 时间:2024/06/07 01:45

  该博客用于在自然语言处理中收集到的一些数据集。

1 情感分析

1.1 情感分析的语料库

  1. 谭松波-酒店评论语料-UTF-8,10000条。现在网上大部分谭松波老师的评论语料资源的编码方式都是gb2312,本资源除了原始编码格式,还具有UTF-8编码格式。 本资源还包含将所有语料分成pos.txt和neg.txt两个文件,每个文件中的一行代表原始数据的一个txt文件,即一篇评论。下载地址为:http://download.csdn.net/detail/qq280929090/9818883

0 0
原创粉丝点击