读书笔记:NOSQL 菜鸟教程

来源:互联网 发布:2017大数据峰会 编辑:程序博客网 时间:2024/06/05 08:43

读书笔记:NOSQL 菜鸟教程

定义

NoSQL(NoSQL = Not Only SQL ),意即”不仅仅是SQL”。
NoSQL用于超大规模数据的存储。(例如谷歌或Facebook每天为他们的用户收集万亿比特的数据)。这些类型的数据存储不需要固定的模式,无需多余操作就可以横向扩展。

关系型数据库遵循ACID规则

事务在英文中是transaction,和现实世界中的交易很类似,它有如下四个特性:
A (Atomicity) 原子性、C (Consistency) 一致性、I (Isolation) 独立性、D (Durability) 持久性

RDBMS vs NoSQL

  • RDBMS *
  • 高度组织化结构化数据
  • 结构化查询语言(SQL) (SQL)
  • 数据和关系都存储在单独的表中。
  • 数据操纵语言,数据定义语言
  • 严格的一致性
  • 基础事务
  • NoSQL *
  • 代表着不仅仅是SQL
  • 没有声明性查询语言
  • 没有预定义的模式
    -键 - 值对存储,列存储,文档存储,图形数据库
  • 最终一致性,而非ACID属性
  • 非结构化和不可预知的数据
  • CAP定理 :CAP理论的核心是:一个分布式系统不可能同时很好的满足一致性,可用性和分区容错性这三个需求,最多只能同时较好的满足两个。
  • 高性能,高可用性和可伸缩性

NoSQL的优点/缺点

优点:
- 高可扩展性
- 分布式计算
- 低成本
- 架构的灵活性,半结构化数据
- 没有复杂的关系
缺点:
- 没有标准化
- 有限的查询功能(到目前为止)
- 最终一致是不直观的程序

BASE

BASE是NoSQL数据库通常对可用性及一致性的弱要求原则:
Basically Availble –基本可用
Soft-state –软状态/柔性事务。 “Soft state” 可以理解为”无连接”的, 而 “Hard state” 是”面向连接”的
Eventual Consistency –最终一致性 最终一致性, 也是是 ACID 的最终目的
文档存储
MongoDB
CouchDB
文档存储一般用类似json的格式存储,存储的内容是文档型的。这样也就有有机会对某些字段建立索引,实现关系数据库的某些功能。
key-value存储
Tokyo Cabinet / Tyrant
Berkeley DB
MemcacheDB
Redis
可以通过key快速查询到其value。一般来说,存储不管value的格式,照单全收。(Redis包含了其他功能)

语法

连接

”’ mongodb://[username:password@]host1[:port1][,host2[:port2],…[,hostN[:portN]]][/[database][?options]] ”’

创建数据库

use DATABASE_NAME 如果数据库不存在,则创建数据库,否则切换到指定数据库。
db 当前数据库
show dbs 所有数据库
db.runoob.insert({“name”:”菜鸟教程”})

删除数据库

db.dropDatabase() 删除当前数据库

删除集合

db.collection.drop() 用法:db.site.drop()
show tables 显示所有集合

插入文档

db.COLLECTION_NAME.insert(document)
db.col.save(document) 如果不指定 _id 字段 save() 方法类似于 insert() 方法。如果指定 _id 字段,则会更新该 _id 的数据。
db.col.find() 查看已插入文档

update()方法

db.collection.update(,,{upsert: ,multi: ,
writeConcern: })

save()方法

db.collection.save(,{writeConcern: }) save() 方法通过传入的文档来替换已有文档

删除文档

db.collection.remove(, ) justOne : (可选)如果设为 true 或 1,则只删除一个文档。

查询文档

db.collection.find(query, projection)

projection :可选,使用投影操作符指定返回的键。查询时返回文档中所有键值, 只需省略该参数即可(默认省略)。
若不指定 projection,则默认返回所有键,指定 projection 格式如下,有两种模式(两种模式不可混用(因为这样的话无法推断其他键是否应返回))
db.collection.find(query, {title: 1, by: 1}) // inclusion模式 指定返回的键,不返回其他键
db.collection.find(query, {title: 0, by: 0}) // exclusion模式 指定不返回的键,返回其他键

db.col.find().pretty() pretty() 方法以格式化的方式来显示所有文档。
操作
格式
范例
RDBMS中的类似语句
等于

{<key>:<value>}db.col.find({"by":"菜鸟教程"}).pretty()where by = '菜鸟教程'

小于

{<key>:{$lt:<value>}}db.col.find({"likes":{$lt:50}}).pretty()where likes < 50

小于或等于

{<key>:{$lte:<value>}}db.col.find({"likes":{$lte:50}}).pretty()where likes <= 50

大于

{<key>:{$gt:<value>}}db.col.find({"likes":{$gt:50}}).pretty()where likes > 50

大于或等于

{<key>:{$gte:<value>}}db.col.find({"likes":{$gte:50}}).pretty()where likes >= 50

不等于

{<key>:{$ne:<value>}}db.col.find({"likes":{$ne:50}}).pretty()where likes != 50

MongoDB AND 条件

db.col.find( {key1:value1, key2:value2} ).pretty()

MongoDB OR 条件

db.col.find({ $or: [{key1: value1}, {key2:value2}] }).pretty()

AND 和 OR 联合使用

db.col.find({"likes": {$gt:50}, $or: [{"by": "菜鸟教程"},{"title": "MongoDB 教程"}]}).pretty()

MongoDB 操作符

gtgreaterthan>gte ——— gt equal >=
ltlessthan<lte ——— lt equal <=
nenotequal!=eq ——– equal =

$type 操作符

db.col.find({“title” : {$type : 2}})
Double
1

String
2

Object
3

Array
4

Binary data
5

Undefined
6
已废弃。
Object id
7

Boolean
8

Date
9

Null
10

Regular Expression
11

JavaScript
13

Symbol
14

JavaScript (with scope)
15

32-bit integer
16

Timestamp
17

64-bit integer
18

Min key
255
Query with -1.
Max key
127

MongoDB Limit() 方法

db.COLLECTION_NAME.find().limit(NUMBER)

MongoDB Skip() 方法

db.COLLECTION_NAME.find().skip(NUMBER).limit(NUMBER)

  • 当查询时同时使用sort,skip,limit,无论位置先后,最先执行顺序 sort再skip再limit。 *
    补充说明skip和limit方法只适合小数据量分页,如果是百万级效率就会非常低,因为skip方法是一条条数据数过去的,建议使用where_limit

MongoDB sort()方法

db.COLLECTION_NAME.find().sort({KEY:1})

MongoDB 索引

db.COLLECTION_NAME.ensureIndex({KEY:1}) 语法中 Key 值为你要创建的索引字段,1为指定按升序创建索引,如果你想按降序来创建索引指定为-1即可。

ensureIndex() 接收可选参数,可选参数列表如下:
(db.values.ensureIndex({open: 1, close: 1}, {background: true}))
Parameter
Type
Description
background
Boolean
建索引过程会阻塞其它数据库操作,background可指定以后台方式创建索引,即增加 “background” 可选参数。 “background” 默认值为false。
unique
Boolean
建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name
string
索引的名称。如果未指定,MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups
Boolean
在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse
Boolean
对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds
integer
指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间。
v
index version
索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights
document
索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重。
default_language
string
对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语
language_override
string
对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language.

MongoDB 聚合

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)db.mycol.aggregate([{$ group : {_id : "$by_user", num_tutorial : {$sum : 1}}}])
原创粉丝点击