python3 [爬虫入门实战]爬虫之mongoDB数据库的安装配置与可视化

来源:互联网 发布:金盾软件 编辑:程序博客网 时间:2024/04/29 11:51

从安装过程到可视化工具可查看数据信息,历时两天,昨天坐了一天的火车,今天早上才到的青岛–>放松心情

前天说是要学习如何使用mongoDB的链接与安装。

到今天过去了将一天, 不过还是在函兮的唠叨下慢慢的安装好了,确实来之不易,一脸懵逼

安装环境: wind10 还是盗版的 磁盘分析:只有一个C盘,


步骤:
1 . 下载
http://www.mongodb.org/downloads

这里下载了对应的msi文件,貌似.zip文件没有了

2 我默认把mongoDB安装到c盘下的目录:C:\Program Files\MongoDB\Server\3.4\bin

3 一开始是没有进行mongdb dbpath 和dblog的配置项,所以会出现 :

由于目标计算机积极拒绝,无法连接

上述问题主要是mongdb没有配置好的原因

4 mongodb 目录文件的配置
cd : C:\Program Files\MongoDB\Server\3.4\bin
到该bin下
输入:mongod.exe –dbpath=C:\data\db

这里的路径可以自由设置

5 再进行dblog的配置,
也是在bin目录下:mongod.exe –dbpath=C:\data\log\mongodb.log


6 检查一下配置是否正常
当然也是在bin下进行:mongo

配置成功的标志:
这里写图片描述


7最后再把mongoDB添加到Windows Service里面
同样也是cd到bin下:
输入:cd D:\mongodb\bin目录下,执行
mongod.exe –dbpath=C:\data\db –logpath=c:data\log\log.txt –install –serviceName “MongoDB”

进行查看:
这里写图片描述

启动,关闭服务:
这里写图片描述

关闭服务:net stop mongodb

这里用的可视化工具:对比了下:

MongoChef

觉着这个应该挺不错的,虽然现阶段我只会一个查看数据的操作:
这里写图片描述

以上就是mongodb的简单配置,在python3中代码可见的部分:

基础存储部分:

#encoding=utf8import requestsimport re# 导入mongo 数据库import pymongoimport json# 打开数据库连接,mongodb默认端口为27017conn = pymongo.MongoClient(host='localhost',port=27017)# 选择或创建数据库toutiao = conn['toutiao']# 选择或者创建数据集合newsdata = toutiao['news']toutiaoUrl = 'http://www.toutiao.com/api/pc/focus/'reqData = requests.get(toutiaoUrl).textprint(reqData)jsonData = json.loads(reqData)newsData = jsonData['data']['pc_feed_focus']# 存储到数据库for new in newsData:    title = new['title']    img_url = new['image_url']    url = new['media_url']    data = {        'title':title,        'img_url':img_url,        'url':url    }    # 插入一行数据    newsdata.insert_one(data)for i in newsdata.find():    # 从数据库中读取出来    print('i'+str(i))

以上的注释都清楚,以后用的mongodb更多功能再进行扩展。

这就是基本的mongodb数据存储,接下来要学习selenium 和 scraper进行数据爬取操作,加快脚步。

阅读全文
0 0