搜索文章收藏

来源:互联网 发布:阿里云自己搭建hadoop 编辑:程序博客网 时间:2024/05/18 16:38

1. 利用 Heritrix 构建特定站点爬虫

http://www.ibm.com/developerworks/cn/opensource/os-cn-heritrix/#iratings

2. 使用 HttpClient 和 HtmlParser 实现简易爬虫

http://www.ibm.com/developerworks/cn/opensource/os-cn-crawler/

3.理解 SPARQL

使用语义 Web 建立微型日志博客

http://www.ibm.com/developerworks/cn/education/xml/x-sparql/index.html

4.我爱自然语言处理

中科院NPL组

http://www.52nlp.cn/

5.跟着学学算法

http://www.cnblogs.com/huangxincheng/

原创粉丝点击