文本标签提取算法

来源:互联网 发布:手机淘宝帐号注册流程 编辑:程序博客网 时间:2024/06/03 19:29

目前想到方法

1,现有分词系统提出关键词,比如ansj,hannlp,word等

2,基于tfidf 算权重

3,基于textrank算法,部分分词系统采取textrank 算法

4,基于语言模型,ngram 算下热度

5,基于聚类打标签,比如基于lda

6,基于语义和知识库知识对于内容分析 总结


当前主要任务是段文本如何打标签准备,还需要很多实验要验证效果

0 0
原创粉丝点击