网络数据抽取(Web data mining)
来源:互联网 发布:ps光头软件 编辑:程序博客网 时间:2024/05/11 12:45
网络数据抽取(Web data mining),主要包括结构化数据抽取(Structured Data Extraction)、信息集成(Information integreation)和观点挖掘(Opinion mining)等;是指从网络中取得大量的又利用价值的数字化信息。
结构化数据抽取(Structured Data Extraction)的目标是从Web页面中抽取结构化数据。这些结构化数据往往存储在后台数据库中,由网页按一定格式承载着展示给用户。例如论坛列表页面、Blog页面、搜索引擎结果页面等。
信息集成(Information integration)是针对结构化数据而言的。其目标是将从不同网站中抽取出的数据统一化后集成入库。其关键问题是如何从不同网站的数据表中识别出意义相同的数据并统一存储。
网络数据抽取技术流程的实现,其具体步骤如下:
第一步,确立采集目标,即由用户选择目标网站。
第二步:提取特征信息,即根据目标网站的网页格式,提取出采集目标数据的通性。
第三步:网络信息获取,即利用工具自动的把页面数据把存到数据库。
- 网络数据抽取(Web data mining)
- 数据挖掘(Data Mining)
- 数据挖掘(Data Mining)
- data mining:数据预处理
- Data Mining for Web Intelligence
- Data Mining on the Web
- 数据挖掘 ------Data Mining(1)
- 数据挖掘(Data Mining, uva1591)
- Data Mining 与 Web Mining有何不同
- data pump (数据抽取)测试
- Mining Data Records in Web Pages ——挖掘网页中的数据记录
- [MSRA040809023]MSRA - Web Search & Data Mining - Researcher
- 读《Mining Data Records in Web Pages》
- 数据挖掘幽默(Data Mining Humor)
- 数据挖掘-——Data Mining(2)
- 数据挖掘-——Data Mining(3)
- Data Mining数据分析经典语录汇总
- Data Mining 数据挖掘学习清单
- ajax的安装
- 文件的读入与读出
- 网上信息抽取技术纵览
- Ycnd GUI已全部完成
- 合唱队形
- 网络数据抽取(Web data mining)
- IIS5.1下载地址
- Head First C# 中文版 第九章 读写文件 page393
- 敏捷软件开发读书笔记2——面向对象的设计原则
- 3D变换中的四元数
- VS2005下如何安装WTL
- 一句把人逗乐的经典
- MVC简介
- 如何为嵌入式开发建立交叉编译环境