python使用MongoDB,备忘

来源:互联网 发布:可可网络验证 多少钱 编辑:程序博客网 时间:2024/05/18 01:50

知识备份,内容多来自知乎的Jerry专栏。

安装pymongo

pymongo是由MongoDB开发者发布的官方驱动程序,官方文档在这里。
安装:

pip install pymongo

在命令行中import pymongo没有异常则安装成功。

建立连接

使用MongoClient对象建立连接:

from pymongo import MongoClientclient = MongoClient()

上面的代码,将默认建立连接到主机(localhost)和端口(27017)。也可以指定主机或端口:

client = MongoClient('localhost', 27017)

或者使用MongoURI格式:

client = MongoClient('mongodb://localhost:27017')

访问数据库

一旦你有一个链接的MongoClient实例,你可以在Mongo服务器中访问任何数据库。可以把一个数据库当做一个属性一样访问:

db = client.meinvxiezhenji

或者也可以使用字典的形式访问:

db = client['meinvxiezhenji']

如果你的指定数据库还没有创建,也没有关系。通过指定此数据库名称并将数据保存到其中,MongoDB将自动为你创建数据库。

插入文档

在数据库中存储数据非常简单,前面已经建立了meinvxiezhenji的连接,这里只需要指定要使用其中的哪个集合就可以了。在MongoDB中,一个集合是在数据库中存储在一起的一组文档(类似于SQL的表)。集合和文档像是SQL的表和行。选择集合后,使用insert_one()方法插入文档到集合中:

posts = db.mzitupost_data = {    'title': 'Python and MongoDB',    'content': 'PyMongo is fun, you guys',    'author': 'who's here'}result = posts.insert_one(post_data)print('One post: {0}'.format(result.inserted_id))

我们甚至可以插入很多文档,使用方法insert_many()。此方法接受一个list参数:

post_1 = {    'title': 'Python and MongoDB',    'content': 'PyMongo is fun, you guys',    'author': 'Scott'}post_2 = {    'title': 'Virtual Environments',    'content': 'Use virtual environments, you guys',    'author': 'Scott'}post_3 = {    'title': 'Learning Python',    'content': 'Learn Python, it is easy',    'author': 'Bill'}new_result = posts.insert_many([post_1, post_2, post_3])print('Multiple posts: {0}'.format(new_result.inserted_ids))

你应该看到类似输出:

One post: 584d947dea542a13e9ec7ae6Multiple posts: [    ObjectId('584d947dea542a13e9ec7ae7'),    ObjectId('584d947dea542a13e9ec7ae8'),    ObjectId('584d947dea542a13e9ec7ae9')]

注意: 不要担心,你和上面显示不一样。它们是在插入数据时,由Unix的纪元,机器标识符和其他唯一数据组成的动态标识。

检索文档

检索文档可以使用find_one()方法,比如要找到author为Pete的记录:

petes_post = posts.find_one({'author': 'Pete'})print(petes_post)

运行结果:

{    'author': 'Bill', 'title': 'Learning Python',    'content': 'Learn Python, it is easy',    '_id': ObjectId('584c4afdea542a766d254241')}

您可能已经注意到,这篇文章的ObjectId是设置的_id,这是以后可以使用唯一标识。如果需要查询多条记录可以使用find()方法:

scotts_posts = posts.find({'author': 'Scott'})print(scotts_posts)

结果:

<pymongo.cursor.Cursor object at 0x109852f98>

他的主要区别在于文档数据不是作为数组直接返回给我们。相反,我们得到一个游标对象的实例。这Cursor是一个包含相当多的辅助方法,以帮助您处理数据的迭代对象。要获得每个文档,只需遍历结果:

for post in scotts_posts:    print(post)

MongoEngine

虽然PyMongo是非常容易使用,总体上是一个伟大的轮子,但是许多项目使用它都可能太低水平。简而言之,你必须编写很多自己的代码来持续地保存,检索和删除对象。PyMongo之上提供了一个更高的抽象一个库是MongoEngine。

MongoEngine是一个对象文档映射器(ODM),它大致相当于一个基于SQL的对象关系映射器(ORM,把表结构映射到对象上,python中比较有名的SQLAlchemy和这个用法挺像的)。MongoEngine提供的抽象是基于类的,所以你创建的所有模型都是类。虽然有相当多的Python的库可以帮助您使用MongoDB,MongoEngine是一个更好的,因为它有一个很好的组合的功能,灵活性和社区支持。

使用pip安装:

pip install mongoengine==0.10.7

连接:

from mongoengine import *connect('mongoengine_test', host='localhost', port=27017)

和pymongo不同。MongoEngine需要制定数据库名称。

定义文档

建立文档之前,需要定义文档中要存放数据的字段。与许多其他ORM类似,我们将通过继承Document类,并提供我们想要的数据类型来做到这一点:

import datetimeclass Post(Document):    title = StringField(required=True, max_length=200)    content = StringField(required=True)    author = StringField(required=True, max_length=50)    published = DateTimeField(default=datetime.datetime.now)

在这个简单的模型中,我们已经告诉MongoEngine,我们的Post实例有title、content、author、published。现在Document对象可以使用该信息来验证我们提供它的数据。

因此,如果我们试图保存Post的中没有title那么它会抛出一个Exception,让我们知道。我们甚至可以进一步利用这个并添加更多的限制:

required:设置必须;default:如果没有其他值给出使用指定的默认值unique:确保集合中没有其他document有此字段的值相同choices:确保该字段的值等于数组中的给定值之一

保存文档

将文档保存到数据库中,我们将使用save()的方法。如果文档中的数据库已经存在,则所有的更改将在原子水平上对现有的文档进行。如果它不存在,那么它会被创建。

这里是创建和保存一个文档的例子:

post_1 = Post(    title='Sample Post',    content='Some engaging content',    author='Scott')post_1.save()       # This will perform an insertprint(post_1.title)post_1.title = 'A Better Post Title'post_1.save()       # This will perform an atomic edit on "title"print(post_1.title)

调用save()的时候需要注意几点:

PyMongo将在您调用.save()时执行验证,这意味着它将根据您在类中声明的模式检查要保存的数据,如果违反模式(或约束),则抛出异常并且不保存数据;

由于Mongo不支持真正的事务,因此没有办法像在SQL数据库中那样“回滚”.save()调用。

当你保存的数据没有title时:

post_2 = Post(content='Content goes here', author='Michael')post_2.save()raise ValidationError(message, errors=errors)mongoengine.errors.ValidationError:ValidationError (Post:None) (Field is required: ['title'])

面向对象的特性

使用MongoEngine是面向对象的,你也可以添加方法到你的子类文档。例如下面的示例,其中函数用于修改默认查询集(返回集合的所有对象)。通过使用它,我们可以对类应用默认过滤器,并只获取所需的对象

class Post(Document):    title = StringField()    published = BooleanField()    @queryset_manager    def live_posts(clazz, queryset):        return queryset.filter(published=True)

关联其他文档

您还可以使用ReferenceField对象来创建从一个文档到另一个文档的引用。MongoEngine在访问时自动惰性处理引用。

class Author(Document):    name = StringField()class Post(Document):    author = ReferenceField(Author)Post.objects.first().author.name

在上面的代码中,使用文档”外键”,我们可以很容易地找到第一篇文章的作者。其实还有比这里介绍的更多的字段类(和参数),所以一定要查看文档字段更多信息。

从所有这些示例中,您应该能够看到,MongoEngine非常适合管理几乎任何类型的应用程序的数据库对象。这些功能使得创建一个高效可扩展程序变得非常容易。如果你正在寻找更多关于MongoEngine的帮助,请务必查阅他们的用户指南。

0 0
原创粉丝点击