《预测性文本挖掘基础》目录

来源：互联网发布：seo网站日志分析工具编辑：程序博客网时间：2024/05/20 18:18

第一章文本挖掘概述

问题定位，文本分类，信息检索，文本聚类，信息提取，预测评估

第二章从文本信息岛数值向量

文档收集文档标准化标记话词形转化预测向量生成语句边界确定词性标签化词义消岐短语识别命名实体识别，语法分析特征生成

第三章用文本进行预测

识别文档符合模式文档分类学习预测性能聘雇

第四章信息检索和文本挖掘

关键字搜索最近邻法度量相似度基于WEB的文档搜索文档匹配反向列表性能评估

第五章文档集合结构发现

基于相似性文档聚类复合文档的相似度聚类标记

第六章在文档中查询信息

信息提取发现文本模式和实体共指和关系提取模板填充和数据库构建

第七章面向预测的数据源：数据库、混杂数据与web

数据的理想化模型，实际数据源，原型化实例，混杂数据实例，采用标准表格格式的混合数据

第八章实例分析

面向数字图书馆的轻型文档匹配生成帮助桌面应用的模本范例新闻文章主题指定邮件过滤搜索引擎文档中命名实体提取个性化报纸

第九章新研究方向

主动学习，使用未标记的数据学习收集文档样本的不同途径分布式文本挖掘学习排序问答系统

0 0