jsoup解析文件存入本地mongodb数据库
来源:互联网 发布:局域网每台机器端口 编辑:程序博客网 时间:2024/06/11 04:55
package Tomongo;import java.io.File;import java.io.IOException;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.Set;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.select.Elements;import com.mongodb.BasicDBObject;import com.mongodb.DB;import com.mongodb.DBCollection;import com.mongodb.MongoClient;public class MonGoTest { public static void main(String[] args)throws IOException { try { //链接momgodb数据库 MongoClient client = new MongoClient("127.0.0.1",27017); //查询所有的数据库名 @SuppressWarnings("deprecation") List<String> databaseNames = client.getDatabaseNames(); for(String name:databaseNames){ System.out.println(name); } //获得一个数据库连接 @SuppressWarnings("deprecation") DB db = client.getDB("baidushujuku"); //查询该数据库所有的集合名 Set<String> collectionNames = db.getCollectionNames(); for(String name:collectionNames){ System.out.println(name); } DBCollection teacher_collection = db.getCollection("teacher3"); //循环读取本地文件 String filepath="F:/webmagic/zhidao.baidu.com"; File file=new File(filepath); if(file.isDirectory()){ String[] filelist=file.list(); for(int i=0;i<filelist.length;i++){ File input=new File(filepath+"\\"+filelist[i]); // File input = new File("F:/webmagic/zhidao.baidu.com/new.txt"); //单个文档输入时候的测试用这一句 Document doc = Jsoup.parse(input,"UTF-8","http://zhidao.baidu.com/"); Elements one = doc.getElementsByClass("tableone"); String a=one.text();//map直接存储不了Elements ,所以转换为String Elements two = doc.getElementsByClass("tabletwo"); String b=two.text(); Elements three = doc.getElementsByClass("tablethree"); String c=three.text(); Elements four = doc.getElementsByClass("tablefour"); String d=four.text(); //使用Map对象 Map<String, Object> map1 =new HashMap<String, Object>(); map1.put("one", a); map1.put("two", b); map1.put("three", c); map1.put("four", d); teacher_collection.insert(new BasicDBObject(map1)); System.out.println("完成!"); } } } catch (Exception e) { e.printStackTrace(); } } }
阅读全文
0 0
- jsoup解析文件存入本地mongodb数据库
- 用Jsoup解析HTML文件,并保存到本地
- 用Jsoup解析HTML文件,并保存到本地
- 解析并且存入数据库
- Jsoup解析HTML文件
- Jsoup解析文件
- JSOUP 解析XML文件
- 上传xls文件并解析数据存入msyql数据库
- 把文件存入数据库
- 读取Excel表格数据存入mongodb数据库
- python批量读取图片,存入mongodb数据库
- 使用Jsoup解析html文件
- 使用JSoup解析HTML文件
- jsoup解析html文件实例
- 如何向MongoDB中存入文件?
- 本地mongodb数据库学习
- 把图片文件存入数据库
- 把图片文件存入数据库
- JavaMail 学习讲解
- HTML DOM Document 对象
- JVM内存结构
- Spring boot 表单提交失败Validation failed for object='book'. Error count: 2
- Twitter分享失败,HTTP 403 error
- jsoup解析文件存入本地mongodb数据库
- 动画的概念
- Node.js中process.cwd()与__dirname
- IP地址如何存放在数据库
- 实现基于深度学习的图像补全(1)图像预处理
- 34. Search for a Range
- jquery uploadify 插件错误 Cannot read property 'queueData' of undefined
- 各种需要的依赖(Android 开发)
- 动态