MongoDB之概述、命令

基础知识

是什么

概念

分布式文件存储数据库,提供高可用、可扩展、易部署的数据存储解决方案。

结构

BSON存储类型

类似JSON的一种二进制存储格式。相比于JSON,提供更丰富的类型支持。

优点是灵活,缺点是空间利用率不佳。

类型 说明 解释 举例
String 字符串 UTF-8编码为合法字符串。 {name:"李四"}
Integer 整型 根据服务器可分为32、64位。 {age:1}
Boolean 布尔值 {flag:true}
Double 双精度浮点值 {number:3.14}
ObjectId 对象ID 用于创建文档的ID {_id:new Object()}
Array 数组 {top:[85,63,42]}
Timestamp 时间戳 { ts: new Timestamp() }
Object 内嵌文档 {obj:{age:18}}
Null 空值 空值或未定义的对象 {key:null}
Date或者 ISODate 格林尼治 时间 日期时间,用Unix日期格 式来存储当前日 期或时 间。 {birth:new Date()}
Code 代码 可包含js代码 {x:function(){}}

其它特殊类型File:

  • 二进制转码小于16M,可用 Base64 存储。
  • 二进制转码大于16M,可用 GridFS 存储。

什么时候使用MongoDB

应用特征

应用特征
不需要事务
不需要复杂join
新应用,需求变动,数据模型无法确定,需要快速迭代开发
应用需要2000以上QPS
应用需要TB、PB级别的数据存储
应用发展迅速,需要快速水平扩展
要求数据不丢失
应用需要99.999%高可用
应用需要大量地理位置查询、文本查询

适用场景

  • 网站数据:适合实时插入、更新、查询,并要求具备复制、高度伸缩性。
  • 缓存:高性能,可作为基础信息设置的缓存层。
  • 存储大尺寸、低价值的数据
  • 高伸缩场景。合适组成几十上百的数据库集群。内置高可用解决方案以及MapReduce引擎。
  • 用于对象、JSON数据的存储。BSON格式合适文档化格式的存储和查询。

行业应用场景

  • 游戏场景。用户信息、装备信息、积分等,内嵌文档存储,方便查询、更新。
  • 物流场景。存储订单信息,通过内嵌文档形式,一下子就可以把订单的所有变更信息查询出来。
  • 社交场景。存储用户信息、朋友圈,查找附近的人等。
  • 物联网场景。存储设备的接入信息,以及设备上报的日志。
  • 直播。用户信息、礼物信息。

GUI工具

MongoDB Compass Community

  • MongoDB提供GUI MongoDB工具
  • 借助内置模式可视化,用户可以分析文档并显示丰富的结构。为了监控服务器的负载,它提供了数据库操作的实时统计信息
  • Compass有两个版本:Enterprise(付费),Community(免费)
  • 适用于Linux,Mac或Windows

MongoBooster

  • 是MongoDB CLI界面中非常流行的GUI工具。它正式名称为MongoBooster
  • NoSQLBooster是一个跨平台,它带有一堆MongoDB 工具来管理数据库和监控服务器
  • 这个Mongodb工具包括服务器监控工具,Visual Explain Plan,查询构建器,SQL查询,
  • ES2017语法支持等等...
  • 适用于Linux,Mac或Windows

Navicat

基础命令

连接

sql 复制代码
mongo --username root --password  --host localhost --port 27017

数据库

当前数据库

db

所有数据库

show dbs
show databases

切换数据库

use <database>

创建数据库

use <newDatabaseName>

删除当前数据库

db.dropDatabase()

集合操作

所有集合(表)

show collections
show tables

查看集合命令帮助

db.<collection>.help()

删除集合

db.<collection>. drop()

插入操作

单条插入

sql 复制代码
db.<collection>.insertOne(
{xm:"张三",age:23}
)

db.myt.insertOne(
{xm:"张三",age:23}
)

多条插入

sql 复制代码
db.<collection>.insertMany([
  {xxx},
  {xxx}
])

db.myt.insertMany([
  {xm:"李四",age:24},
  {xm:"王五",age:25},
  {xm:"赵六",age:26},
  {xm:"李四",age:34},
  {xm:"王五",age:35},
  {xm:"赵六",age:36}
])

查询操作

基础查询

操作 格式 对比
= {key:value} where a = 1
> {key:{$gt:value}} where a > 1
< {key:{$lt:value}} where a < 1
>= {key:{$gte:value}} where a >= 1
<= {key:{$lte:value}} where a <= 1
!= {key:{$ne:value}} where a != 1
等值查询

db.<collection>.find({<field>:<value>})
db.myt.find({xm:"张三"})

IN查询

db.<collection>.find({<field>:{<option>:<value>}})
db.myt.find({xm:{$in:["张三","李四"]}})

AND查询

db.<collection>.find({<field>:<value>,<field>:<value>})
db.myt.find({xm:"李四", age:34})
db.myt.find({xm:"李四", age:{$gt:30}})

范围查询

db.myt.find({xm:"李四", age:{$gt:30}})

OR查询

db.<collection>.find({$or:[{<field>:<value>},{<field>:<value>}]})
db.myt.find( {$or: [ {xm: "李四"}, {age: {$lt: 26}} ] } )

AND+OR查询

db.<collection>.find({<field>:<value>, $or:[{<field>:<value>},{<field>:<value>}]})

类似于:select * from t where a = 1 and ( b = 1 or b = 2)

db.myt.find( { xm:"李四", $or:[{age:{$lt: 25}},{age:35}] } )

!=查询

db.<collection>.find({<field>:{$ne:<value>}})
db.myt.find({xm:{$ne:"李四"}})

分页查询

db.<collection>.find().sort({<排序列>:<排序方式>}).limit(单页数)
升序:db.myt.find().sort({age:1}).limit(3)
降序:db.myt.find().sort({age:-1}).limit(3)

数组查询

等值查询

db.myt.insertOne( {xm:"孙八",age:28,size:{h:165,w:54},tags:["家财万贯","不惑之年"]} )
db.myt.find({tags:["家财万贯","不惑之年"]})

包含查询

db.myt.find({tags:{$all:["家财万贯"]}})

在指定下标下进行查询

db.myt.find( {"tags.2":{$lt:65}} )

sql 复制代码
db.myt.insertMany([
  {xm:"李四",age:43, size:{h:165,w:54}, tags:["不惑之年","家财万贯", 78]},
	{xm:"王五",age:61, size:{h:167,w:56}, tags:["花甲","家财万贯", 65]},
  {xm:"赵六",age:54, size:{h:174,w:64}, tags:["知天命", 59]},
])
数组长度等于n的文档

db.myt.find( {tags:{$size:3}} )

查询null或者丢失的字段

db.myt.find( {tags: null} )

删除操作

删除所有

db.myt.deleteMany({})

按条件删除

db.<collection>.deleteMany( { <field1>: { <operator1>: <value1> }, ... } )
db.my2.deleteMany( {xm:"王五"})

只删除一个符合条件的

db.<collection>.deleteOne( { <field>: <value> } )
db.my2.deleteOne( {xm:"李四"} )

更新操作

更新格式

sql 复制代码
db.集合名.update(
  <query>,
  <update>,
  {
  upsert: <boolean>,
  multi: <boolean>,
  writeConcern: <document>
  }
)

-- 更新一个
updateOne()
-- 更新所有符合条件的
updateMany()
-- 文档替换。多个匹配结果也只替换一个。
replaceOne()
  • query:查询条件
  • update :set操作,包括:
    • $set:设置字段值。
    • $unset :删除指定字段。
    • $inc :增加指定数值。
  • upsert(可选):默认false。不存在更新的记录时是否新增。
  • multi (可选):默认false。只更新找到的第一条记录。
  • writeConcern (可选):指定写操作的回执行为。如 写操作是否需要确认。包括 { w: <value>, j:<boolean> , wtimeout: <number>}字段。
    • w :默认1。
      • n:指定写操作传播到的成员数量,即比如 写操作 要求得到n个MongoDB实例或副本集的主要成员的确认。
      • 0:不要求确认写操作。
      • " majority":要求写操作得到大多数成员( members[n].votes 值大于0的成员 )的确认。
    • j:确认写操作是否写入硬盘日志。确认的数量由w值来指定。
    • wtimeout :指定write concern的时间限制,w > 1时生效。
      • 超过指定时间之后,写操作返回error,不管最后是否执行成功;超时之前的成功操作的数据也不会撤销。
      • 未指定 或值为 0 时不会限制时间,写操作将无限制等待。

符号对照表

字段运算符 说明
$currentDate 将指定字段的值设置为当前日期
$inc 增加指定数值
$min 字段值小于指定值才更新
$max 字段值大于指定值才更新
$mul 字段值与指定值相乘
$rename 重命名字段
$set 设置字段值
$setOnInsert 如果更新操作导致插入文档,则设置指定字段的值。单纯的修改无影响。
$unset 删除指定字段
数值运算符 说明
$ 充当占位符。更新与查询条件匹配的第一个元素。
$[] 充当占位符。更新数组中与查询条件匹配的文档中的所有元素
$addToSet 只有元素不在数组中时才添加到数组。
$pop 删除数组第一或最后一个元素
$pull 删除符合匹配条件的所有元素
$push 添加元素到数组
$pullAll 删除数组中所有匹配的元素
修饰符 说明
$each 遍历
$position 指定下标
$slice
$sort

注意点

  • 写操作在单一文档上是原子性。
  • 设定 _id 之后不要更新。

更新案例

sql 复制代码
db.my2.update( 
  {xm:"李四"}, 
  { 
    $set:{age:25}, 
    $currentDate:{lastModified:true} 
  }
)
-- 注:当前日期写入到lastModified字段,字段不存在则创建
db.my2.update( 
  {xm:"李四"}, 
  { 
    $set:{age:25}, 
    $currentDate:{lastModified:true} 
  },
  { multi: true }
)

文档替换

sql 复制代码
db.my2.replaceOne( 
  {xm:"王五"}, 
  {xm:"王五", age:34,size:{h:168,w:62}} 
)

聚合操作

聚合操作分类

聚合管道

文档进入多阶段的管道,这些文档将转化为聚合结果。

sql 复制代码
db.orders.aggregate([
   { $match: { status: "A" } }, -- 一阶段
   { $group: { _id: "$cust_id", total: { $sum: "$amount" } } }  -- 二阶段
])

Map-Reduce

单用途聚合操作

测试数据

sql 复制代码
-- 测试数据:
db.authors.insertMany([
  { "author" : "Vincent", "title" : "Java Primer", "like" : 10 },
  { "author" : "Vincent", "title" : "Java Primer", "like" : 10 },
  { "author" : "della", "title" : "iOS Primer", "like" : 30 },
  { "author" : "benson", "title" : "Android Primer", "like" : 20 },
  { "author" : "Vincent", "title" : "Html5 Primer", "like" : 40 },
  { "author" : "louise", "title" : "Go Primer", "like" : 30 },
  { "author" : "yilia", "title" : "Swift Primer", "like" : 8 }
])

单目的聚合操作

单目的聚合命令常用的有:count()distinct() group()

sql 复制代码
db.authors.find({like:{$lt:20}}).count()
db.authors.distinct("like")

聚合管道操作

格式说明

一般用于统计数据。常用操作:

  • $match :过滤数据。
  • $project :修改传入文档的结构。可用于重命名、增加、删除域、创建计算结果和嵌套文档。
  • $group :集中文档,统计结果。
  • $sort :排序。
  • $limit :限制返回的结果数。
sql 复制代码
db.authors.aggregate([
    { $match: { status: "A" } },
    { $group: { _id: "$cust_id", total: { $sum: "$amount" } } }
])

-- like、author为字段名称
db.authors.aggregate([
  	{ $match: { author: {$in:["louise", "della"]} } },
    { $group: { _id: "$like", total: { $sum: "$like" } } }
])
筛选
sql 复制代码
db.authors.aggregate(
	{"$match": {"like": {"$gt" : 10} }}
)
分组
sql 复制代码
-- _id 、count 对应 select user_id as id , sum(xxx) as count
db.authors.aggregate(
  {"$match": {"like": {"$gte" : 25} }},
  {"$group": {"_id": "$author", "count": {"$sum": 1}}}
)
多字段分组
sql 复制代码
db.authors.aggregate(
  {"$match": {"like": {"$gte" : 25} }},
  {"$group": {"_id": {a:"$author",b:"$like"}, "count": {"$sum": 1}}}
)
分组取最值
sql 复制代码
db.authors.aggregate(
	{"$group": {"_id": "$author", "count": {"$max": "$like"}}}
)
分组取平均值
sql 复制代码
db.authors.aggregate(
	{"$group": {"_id": "$author", "count": {"$avg": "$like"}}}
)
分组结果写入Set集合
sql 复制代码
-- 根据author字段分组,分组结果写入名为like的集合
db.authors.aggregate(
	{"$group": {"_id": "$author", "like": {"$addToSet": "$like"}}}
)

{ "_id" : "Vincent", "like" : [ 40, 10 ] }
{ "_id" : "yilia", "like" : [ 8 ] }
{ "_id" : "della", "like" : [ 30 ] }
{ "_id" : "benson", "like" : [ 20 ] }
{ "_id" : "louise", "like" : [ 30 ] }
分组结果写入List集合
sql 复制代码
db.authors.aggregate(
	{"$group": {"_id": "$author", "like": {"$push": "$like"}}}
)
{ "_id" : "Vincent", "like" : [ 10, 40, 10 ] }
{ "_id" : "yilia", "like" : [ 8 ] }
{ "_id" : "della", "like" : [ 30 ] }
{ "_id" : "benson", "like" : [ 20 ] }
{ "_id" : "louise", "like" : [ 30 ] }
$project案例:结果中排除字段、字段重命名

0不显示此字段、1显示此字段。

sql 复制代码
-- 结果集不显示_id字段
db.authors.aggregate(
  {"$match": {"like": {"$gte" : 10} }},
  {"$project": {"_id": 0, "author":1, "title": 1}}
)

-- 重命名
db.authors.aggregate(
  {"$match": {"like": {"$gte" : 10} }},
  {"$project": {"_id": 0, "author":1, "B-Name": "$title"}}
)
$limit案例、排序
sql 复制代码
db.authors.aggregate(
  {"$match": {"like": {"$gte" : 10} }},
  {"$group": {"_id": "$author", "count": {"$sum": 1}}},
  {"$sort": {"count": -1}},
  {"$limit": 1}
)
算数表达式案例
add 指定字段值加 n
sql 复制代码
-- like字段值 + 1
db.authors.aggregate(
	{"$project": {"newLike": {"$add": ["$like", 1]}}}
)

{ "_id" : ObjectId("63b2b63e653186ee23d724b3"), "newLike" : 11 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b4"), "newLike" : 31 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b5"), "newLike" : 21 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b6"), "newLike" : 41 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b7"), "newLike" : 31 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b8"), "newLike" : 9 }
{ "_id" : ObjectId("63b2d5a7653186ee23d724b9"), "newLike" : 11 }
subtract 指定字段值减 n
sql 复制代码
db.authors.aggregate(
{"$project": {"newLike": {"$subtract": ["$like", 2]}}}
)

{ "_id" : ObjectId("63b2b63e653186ee23d724b3"), "newLike" : 8 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b4"), "newLike" : 28 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b5"), "newLike" : 18 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b6"), "newLike" : 38 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b7"), "newLike" : 28 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b8"), "newLike" : 6 }
{ "_id" : ObjectId("63b2d5a7653186ee23d724b9"), "newLike" : 8 }
multiply 乘法
sql 复制代码
db.authors.aggregate(
	{"$project": {"newLike": {"$multiply": ["$like", 10]}} }
)

{ "_id" : ObjectId("63b2b63e653186ee23d724b3"), "newLike" : 100 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b4"), "newLike" : 300 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b5"), "newLike" : 200 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b6"), "newLike" : 400 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b7"), "newLike" : 300 }
{ "_id" : ObjectId("63b2b63e653186ee23d724b8"), "newLike" : 80 }
{ "_id" : ObjectId("63b2d5a7653186ee23d724b9"), "newLike" : 100 }
divide 除法
sql 复制代码
db.authors.aggregate(
	{"$project": {"newLike": {"$divide": ["$like", 10]}} }
)
mod 余数
sql 复制代码
db.authors.aggregate(
	{"$project": {"newLike": {"$mod": ["$like", 3]}} }
)
substr 字符串截取
sql 复制代码
db.authors.aggregate(
	{"$project": {"newTitle": {"$substr": ["$title", 1, 2] } }}
)
concat 字符串拼接
sql 复制代码
db.authors.aggregate(
	{"$project": {"newTitle": {"$concat": ["$title", "(", "$author", ")"] }
}}
)
toLower 字符串转大、小写
sql 复制代码
db.authors.aggregate(
	{"$project": {"newTitle": {"$toLower": "$title"} }}
)
-- 大写
db.authors.aggregate(
	{"$project": {"newAuthor": {"$toUpper": "$author"} }}
)
日期表达式案例

获取日期任意一部分
$year、$month、$dayOfMonth、$dayOfWeek、$dayOfYear、$hour、$minute、$second

sql 复制代码
-- 给示例数据补充字段
db.authors.update(
  {},
  {"$set": {"publishDate": new Date()}},
  true,
  true
)
-- 查询月份
db.authors.aggregate(
{"$project": {"month": {"$month": "$publishDate"}}}
)
运算符案例
cmp 大小比较

$cmp: [exp1, exp2]

  • 等于返回 0
  • 小于返回一个负数
  • 大于返回一个正数
sql 复制代码
db.authors.aggregate(
	{"$project": {"result": {"$cmp": ["$like", 20]} }}
)
and 条件

$and:[exp1, exp2, ..., expN]

多个条件都为true时才返回true。

git 复制代码
db.authors.aggregate(
  {"$project": 
		{
      "result": {
				"$and": [{"$eq": ["$author", "Vincent"]}, {"$gt":["$like", 20]}]
			}
		}
  }
)
or 条件
json 复制代码
db.authors.aggregate(
  {
    "$project": 
    {
      "result": 
      {
        "$or": [{"$eq": ["$author", "Vincent"]}, {"$gt": ["$like",20]}]
      }
    }
  }
)
not 不等于
json 复制代码
db.authors.aggregate(
	{"$project": {"result": {"$not": {"$eq": ["$author", "Vincent"]}}}}
)
cond 三元运算符

$cond: [booleanExp, trueExp, falseExp]

json 复制代码
db.authors.aggregate(
  {"$project": {
    "result": {"$cond": [ {"$eq": ["$author", "Vincent"]}, "111", "222"
    ]}}
  }
)
ifNull 非空
git 复制代码
# 测试数据
db.authors.insertMany([
	{  "title" : "Swift Primer", "like" : 8 }
])

db.authors.aggregate(
  {"$project": {
  "result": {"$ifNull": ["$author", "not exist is null"]}}
  }
)

{ "_id" : ObjectId("63b2b63e653186ee23d724b3"), "result" : "Vincent" }
{ "_id" : ObjectId("63b2b63e653186ee23d724b4"), "result" : "della" }
{ "_id" : ObjectId("63b2b63e653186ee23d724b5"), "result" : "benson" }
{ "_id" : ObjectId("63b2b63e653186ee23d724b6"), "result" : "Vincent" }
{ "_id" : ObjectId("63b2b63e653186ee23d724b7"), "result" : "louise" }
{ "_id" : ObjectId("63b2b63e653186ee23d724b8"), "result" : "yilia" }
{ "_id" : ObjectId("63b2d5a7653186ee23d724b9"), "result" : "Vincent" }
{ "_id" : ObjectId("63b4d7177613bd03eda74636"), "result" : "not exist is null" }

MapReduce

格式说明

MongoDB不允许Aggregation Pipeline的单个聚合操作占用过多的系统内存,如果一个聚合操作消耗20%以上的内存,那么MongoDB直接停止操作,并向客户端输出错误消息。

所以 MapReduce 价值很大。

git 复制代码
db.collection.mapReduce(
  function() {emit(key,value);}, //map 函数,遍历collection 中所有的记录,并将 key 与 value 传递给 Reduce
  function(key,values) {return reduceFunction}, //reduce 函数,处理Map传递过来的所有记录
  {
    out: collection,
    query: document,
    sort: document,
    limit: number,
    finalize: <function>,
    verbose: <boolean>
  }
)
  • out :存放统计结果的集合。
  • query :满足条件的文档才调用map函数。
  • sort :一般用于配合limit。优化分组。
  • limit :发往map函数文档数量的上限。
  • finalize :对reduce函数输出结果进行最后的处理。
  • verbose :是否包括结果信息中的时间信息,默认false。
测试数据
git 复制代码
db.posts.insert({"post_text": "测试mapreduce。", "user_name": "Vincent",
"status":"active"})
db.posts.insert({"post_text": "适合于大数据量的聚合操作。","user_name": "Vincent",
"status":"active"})
db.posts.insert({"post_text": "this is test。","user_name": "Benson",
"status":"active"})
db.posts.insert({"post_text": "技术文档。", "user_name": "Vincent",
"status":"active"})
db.posts.insert({"post_text": "hello word", "user_name": "Louise",
"status":"no active"})
db.posts.insert({"post_text": "lala", "user_name": "Louise",
"status":"active"})
db.posts.insert({"post_text": "天气预报。", "user_name": "Vincent",
"status":"no active"})
db.posts.insert({"post_text": "微博头条转发。", "user_name": "Benson",
"status":"no active"})
条件过滤、分组、求和
git 复制代码
# 结果输出到 post_total 集合
# this代表当前集合
db.posts.mapReduce(
  function() { emit(this.user_name,1); },
  function(key, values) {return Array.sum(values)}, # 求和
  {
    query:{status:"active"}, # 过滤
    out:"post_total" 
  }
)
# 查询结果集合
db.post_total.find()


# 可以换一种写法
var mapFunction1 = function() {
   emit(this.user_name, 1);
};

var reduceFunction1 = function(key, values) {
   return Array.sum(values);
};

db.posts.mapReduce(
   mapFunction1,
   reduceFunction1,
   { out: "post_total2" }
)
相关推荐
时差95328 分钟前
【面试题】Hive 查询:如何查找用户连续三天登录的记录
大数据·数据库·hive·sql·面试·database
让学习成为一种生活方式30 分钟前
R包下载太慢安装中止的解决策略-R语言003
java·数据库·r语言
秋意钟1 小时前
MySQL日期类型选择建议
数据库·mysql
Dxy12393102162 小时前
python下载pdf
数据库·python·pdf
桀桀桀桀桀桀2 小时前
数据库中的用户管理和权限管理
数据库·mysql
superman超哥3 小时前
04 深入 Oracle 并发世界:MVCC、锁、闩锁、事务隔离与并发性能优化的探索
数据库·oracle·性能优化·dba
用户8007165452003 小时前
HTAP数据库国产化改造技术可行性方案分析
数据库
engchina4 小时前
Neo4j 和 Python 初学者指南:如何使用可选关系匹配优化 Cypher 查询
数据库·python·neo4j
engchina4 小时前
使用 Cypher 查询语言在 Neo4j 中查找最短路径
数据库·neo4j
尘浮生4 小时前
Java项目实战II基于Spring Boot的光影视频平台(开发文档+数据库+源码)
java·开发语言·数据库·spring boot·后端·maven·intellij-idea