Java通过关键字搜索出百度百科词条摘要的代码
来源:互联网 发布:et软件视频教程 编辑:程序博客网 时间:2024/06/05 20:12
package com.hply.kuzo.baidu.baike;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
import java.util.ListIterator;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class BaikeUtil {
public static List<String> queryBaike(String keyword) throws IOException {
Document doc = Jsoup.connect(
"http://baike.baidu.com/search/none?word=" + keyword
+ "&pn=0&rn=10&enc=utf8").get();
String url = doc.select("a.result-title").first().attr("href");
System.out.println(url);
doc = Jsoup.connect(url).get();
List<String> result = new ArrayList<String>();
ListIterator<Element> paras = doc.select("div.lemma-summary")
.select("div.para").listIterator();
while (paras.hasNext()) {
result.add(paras.next().text());
}
return result;
}
public static void main(String[] args) throws Exception {
// System.out.println(queryBaike("耳根"));
// System.out.println("-------------------------");
// System.out.println(queryBaike("诛仙"));
System.out.println("-------------------------");
System.out.println(queryBaike("马自达"));
}
}
依赖于
<dependencies>
<dependency>
<groupId>org.jsoup</groupId>
<artifactId>jsoup</artifactId>
<version>1.8.3</version>
</dependency>
</dependencies>
jsoup的使用参考的这篇文章:
非常好用的一个Html解析的java类库 Jsoup
http://blog.csdn.net/huangxy10/article/details/8185108
0 0
- Java通过关键字搜索出百度百科词条摘要的代码
- 百度词条的搜索
- java爬取百度百科词条
- 百度百科个人词条怎样才能确保被通过?
- 仿百度词条搜索功能代码
- 百度百科 > 浏览词条 lua
- python爬虫-百度百科词条
- 做一个类似于百度百科词条的东西
- 百度百科词条中对PX的描述竟是“剧毒
- 使用python实现简单的百度百科词条爬虫
- 简单的python爬虫(爬取百度百科词条)
- Java爬虫爬取python百度百科词条及相关词条页面
- 百度词条搜索建议
- 百度词条搜索功能
- 按条件爬取百度百科词条及其相关词条的ID
- 【分享】百度百科500万词条
- Python爬虫,爬取百度百科词条
- Python爬虫爬取百度百科词条
- Windows和Linux环境下Memcached安装与配置
- javascript 基础知识3(对象)
- ExtJS获取父子、兄弟容器元素方法
- 38、JS取json的值
- nginx 解决session共享问题(jvm-route)方式(其实没有真正解决共享问题)
- Java通过关键字搜索出百度百科词条摘要的代码
- Oracle -- 授予用户权限
- jsonp
- Fresco简介:一个新的Android图片加载库
- 第六周上机实践项目1:分数类雏形
- Listview中加载大量缩略图(优化)
- 代码示例上线,开发so easy!
- odoo8新旧API related字段类型详解
- math3.util.BigReal