DataScraper产品介绍
来源:互联网 发布:网络创世纪单机版 编辑:程序博客网 时间:2024/05/19 10:14
DataScraper是Web页面信息提取(网页抓取/抽取)工具,利用MetaStudio生成的信息提取指令文件,对属于相同语义类别的页面信息进行连续提取,生成XML格式的信息提取结果文件,并将信息提取结果文件存储在DataStore服务器中。DataScraper提供基于图形界面(GUI)的结果文件管理工具和Lucene v2.3.2索引库管理工具。
DataScraper是信息提取(网页抓取/抽取)工具包MetaSeeker的四个工具软件其中一个。
DataScraper是一个通用的屏幕抓取/数据抽取/网页抓取/信息提取工具
屏幕抓取器,即Screen Scraper,有时也叫网页抓取、数据抽取、网络信息提取器,从展现在浏览器上的Web页面内容中提取需要的信息,在万维网领域,为了从各种信息源汇聚信息,成千上万的技术人员开发出基于各种技术的屏幕抓取器,这些抓取器往往是为特定目的针对特定页面的,所以,数量众多,开发成果可继承性很小,研发费用很大,而且需要持续投入。
研制DataScraper及其MetaSeeker工具包的初衷就是帮助用户节省大量的屏幕抓取器的开发投入,使用户专注于业务的设计和网站的经营。为了实现这个目标,作者运用多种先进技术,科学地设计系统架构,将屏幕抓取功能分解成信息结构定义和工作流驱动的Web页面信息提取(网页抓取/抽取)两个子系统,前者集中在MetaStudio产品中实现,而后者集中在本文介绍的DataScraper产品中实现。借助于XML技术和Mozilla应用开发平台,DataScraper以及MetaSeeker表现了强大的屏幕抓取功能。全面的产品特点介绍参见MetaSeeker产品介绍。
资源
- 如果您想获得安装指导,请参阅MetaSeeker安装手册;
- 如果您想了解产品的基本操作方法,请参阅DataScraper用户手册;
- 如果您想体验提取产品列表或者黄页信息的过程,请跟随MetaSeeker使用实例1和使用实例2的步骤;
- 如果您想深入了解产品技术,请参阅MetaSeeker技术手册。
- DataScraper产品介绍
- MetaStudio和DataScraper链接失败及登陆问题的解决(GooSeeker产品)
- 产品介绍
- 产品介绍
- 产品介绍
- DataScraper数据抓取快速入门
- 产品介绍和产品说明
- NAS存储产品介绍
- Lotus 所有产品介绍
- BusinessObjects产品介绍
- BEA Elink 产品介绍
- Stryon产品方案介绍
- Cognos产品功能介绍
- GFI EndPointSecurity产品介绍
- Telelogic产品介绍
- Skyline产品总体介绍
- EOS 产品介绍
- web防火墙产品介绍
- micro_httpd代码解释
- oracle重要视频(如ocp)
- C#你不能不知道的事(一)
- 一个整数数组,用后面的元素减去前面的元素,求最大值。
- 网页抓取/数据抽取/信息提取软件工具包MetaSeeker
- DataScraper产品介绍
- 搭建Android生产环境傻瓜教程(二)开发环境
- 跟我一起写 Makefile(三)
- 从2-3-4树谈到Red-Black Tree(红黑树)
- MetaStudio产品介绍
- 设计模式之Decoartor模式
- 阻止jQuery事件冒泡
- 统计某个文件中出现的字符个数,数字个数,空格个数,总共有多少行?
- List<Map<String,Object>>使用Java代码遍历以获取String,Object的值