【百度百科】文本数据挖掘
来源:互联网 发布:大学取消事业编制 知乎 编辑:程序博客网 时间:2024/05/16 07:58
文本数据挖掘(Text Mining)是指从文本数据中抽取有价值的信息和知识的计算机处理技术。
- 文本数据挖掘
- Text Mining
- 基于单文档的数据挖掘等
- 文本分类,文本聚类等
概念
顾名思义,文本数据挖掘是从文本中进行数据挖掘(Data Mining)。从这个意义上讲,文本数据挖掘是数据挖掘的一个分支。
文本挖掘种类
1.基于单文档的数据挖掘
2.基于文档集的数据挖掘
文本挖掘方法
1.文本分类
文本分类是一种典型的机器学习方法,一般分为训练和分类两个阶段。
2.文本聚类
文本聚类是一种典型的无监督式机器学习方法,聚类方法的选择取决于数据类型。
3.信息抽取
4.摘要
5.压缩
其中,文本分类和聚类是两种最重要最基本的挖掘功能。
挖掘工具
1.IBM DB2 intelligent Miner
2.SAS text miner
3.SPSS Text Mining
4.DMC TextFilter(纯文本抽出通用程序库)
应用
文本挖掘传统商业方面的应用主要有,企业竞争情报、CRM、电子商务网站、搜索引擎,现在已扩展到医疗、保险和咨询行业。
0 0
- 【百度百科】文本数据挖掘
- 数据挖掘--文本挖掘
- 抓取百度百科数据
- 文本数据挖掘--1
- Python数据挖掘-文本挖掘
- 【数据挖掘】文本分类器
- 文本数据挖掘-----词向量
- 数据挖掘文本分类实验
- 元数据——百度百科
- PHP抓取百度百科数据实践
- Python爬取百度百科页面数据
- 文本挖掘--数据文本处理-java
- 文本数据挖掘之文本信息抽取
- 数据挖掘 NLP 之 文本挖掘 文本处理 通用流程
- 百度百科
- 百度百科
- 百度----百科
- 百度百科
- POJ-2586-Y2K Accounting Bug [规律]
- 这位老哥拯救了我的平板!
- C语言运算符优先级 详细列表
- JSON与js对象
- 面对对象
- 【百度百科】文本数据挖掘
- 【c++】虚函数和虚表
- 49. Group Anagrams 题解
- Mybatis和Hibernate
- git知识总结
- Web移动端Css Fixed方式的布局方案
- JS深入之趣味比较隐式转换(一)
- 51nod 1073 约瑟夫环(递推)
- 二叉树的后序遍历