关键字提取工具(面向英文)

来源:互联网 发布:网络布线工程验收单 编辑:程序博客网 时间:2024/04/30 10:03

最近研究关键字提取技术(毕设需要)。语料集是英文。推荐一些相关工具。

开源工具:
RAKE(https://github.com/zelandiya/RAKE-tutorial)
KEA(http://www.nzdl.org/Kea/) 监督式机器学习,使用训练数据和受控词表。
maui indexer(https://code.google.com/archive/p/maui-indexer/) 在kea的基础上进行拓展,增加新的特征项目,拓展了维基百科作为受控词表。
carrot2(http://project.carrot2.org/) 无监督方法,支持多种输入,输出格式和参数设置。
mallet topic modeling module(http://mallet.cs.umass.edu/topics.php)
Stanford topic modeling tool (http://nlp.stanford.edu/software/tmt/tmt-0.3/)
Mahout clustering algorithms(http://mahout.apache.org/)

商业API:
Alchemy API(http://www.alchemyapi.com/api/keyword-extraction)
zemanta API(http://developer.zemanta.com/)
yahoo term extraction api
(https://developer.yahoo.com/search/content/V1/termExtraction.html)

作为穷人,必然是开源的优先,目前主要使用了RAKE,KEA和maui indexer。
最初接触RAKE(Rapid Automatic Keyword Extraction)算法是通过伯乐在线的一篇翻译版的文章(http://python.jobbole.com/82230/),这篇文章的原作者是Alyona Medelyan,RAKE的更新版本就是她完成的,muai indexer也是她的杰作,她的GitHub上有很多关键字提取的项目。(https://github.com/zelandiya),目前在新西兰经营了一家NLP相关的公司。大部分论文和资料都可以在提供的链接中找到。

参考文献:
[1 ] Automatic keyword extraction from individual documents。
[2 ] KEA Practical Automatic Keyphrase Extraction
[3 ] Keyphrase Extraction in Scientific Publications

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 充电剃须刀托运了怎么办 米饭煮夹生了怎么办 电锅烧干了怎么办 电煎饼锅烧黑了怎么办 电高压锅不加热怎么办 食品流通证到期怎么办 喝了奶茶睡不着怎么办 喝咖啡晚上睡不着怎么办 煮米饭水放少了怎么办 蜗牛睡眠两个人怎么办 军用水壶变形了怎么办 鱼缸过滤效果不好怎么办? 煮水壶有水垢怎么办 猫咪喝了咖啡怎么办 军用水壶凹了怎么办 新电水壶有味道怎么办 猫夏天不喝水怎么办 军用水壶瘪了怎么办 木头壶盖有异味怎么办 挎包拉链坏了怎么办 斜挎包没有拉链怎么办 树脂补牙没抛光怎么办 猪拉稀不吃食怎么办 亚麻衣服刺皮肤怎么办 自热米饭不熟怎么办 孕妇用了微波炉怎么办 蛋挞变软了怎么办 外卖炒面坨了怎么办 手机发热充电慢怎么办 饭盒盖子松了怎么办 饭盒盖子盖不住怎么办 饭盒盖子吸不住怎么办 饭盒盖子变形了怎么办 饭盒盖子凹进去怎么办 饭盒盖吸不住怎么办 饭盒微波炉加热后打不开怎么办 微波炉加热饭盒打不开怎么办 塑料饭盒加热后打不开怎么办 真空锅锅盖打不开怎么办 玻璃真空水壶打不开怎么办 保温饭盒盖子打不开怎么办