《预测性文本挖掘基础》目录

来源:互联网 发布:seo网站日志分析工具 编辑:程序博客网 时间:2024/05/20 18:18
第一章 文本挖掘概述
      问题定位,文本分类,信息检索,文本聚类,信息提取,预测评估
第二章 从文本信息岛数值向量
      文档收集 文档标准化 标记话 词形转化 预测向量生成 语句边界确定 词性标签化 词义消岐 短语识别命名实体识别,语法分析 特征生成
第三章 用文本进行预测
      识别文档符合模式 文档分类 学习预测 性能聘雇
第四章 信息检索和文本挖掘
      关键字搜索最近邻法 度量相似度 基于WEB的文档搜索 文档匹配 反向列表 性能评估
第五章 文档集合结构发现
    基于相似性文档聚类 复合文档的相似度 聚类标记 
第六章 在文档中查询信息
      信息提取发现文本模式和实体 共指和关系提取 模板填充和数据库构建
第七章 面向预测的数据源:数据库、混杂数据与web
      数据的理想化模型,实际数据源,原型化实例,混杂数据实例,采用标准表格格式的混合数据
第八章 实例分析
       面向数字图书馆的轻型文档匹配 生成帮助桌面应用的模本范例 新闻文章主题指定 邮件过滤 搜索引擎文档中命名实体提取 个性化报纸
第九章 新研究方向
主动学习,使用未标记的数据学习 收集文档样本的不同途径 分布式文本挖掘 学习排序 问答系统
0 0
原创粉丝点击