MongoDB是什么?
- MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
- MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似Json的Bson格式,因此可以存储比较复杂的数据类型。
- MongoDB 最大的特点是它支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库单表查询的绝大部分功能,而且还支持对数据建立索引。并且MongoDB-4.2版本开始已经支持分布式事务功能。
简而言之的话就是:MongoDB是一个文档型的NoSQL数据库,用于构建高并发、高可用和高扩展的互联网应用程序。
MongoDB概念解析(重点)
无论我们学习什么数据库都应该先了解对应数据库的基本概念,在MongoDB中基本的概念是文档、集合、数据库,下面我们挨个介绍。
MongoDB和RDBMS术语概念对比
虽然 MongoDB 与传统的 RDBMS 共享一些相同的术语,但其他一些是 NoSQL 数据库所独有的。为了帮助了解它们的分别,下表将 RDBMS 使用的术语与 MongoDB 使用的术语进行比较:
RDBMS术语/概念 | MongoDB 术语/概念 | 解释/说明 |
---|---|---|
database | database | 数据库 |
table | collection | 数据库表/集合 |
row | document | 数据记录行/文档 |
column | field | 数据字段/域 |
index | index | 索引 |
table joins | 嵌入式文档 | 表连接,MongoDB不支持表连接只支持嵌入式文档 |
primary key | primary key | 主键,MongoDB自动将 _id 字段设置为主键(默认键 _id 由 MongoDB 提供) |
通过下图实例,我们也可以更直观的的了解 MongoDB 中的一些概念:

MongoDB文档
概述:
MongoDB 的文档确实是一组键值(key-value)对(即 BSON),并且不需要设置相同的字段或相同的数据类型。这些特点使得 MongoDB 成为处理非结构化和半结构化数据的理想选择,尤其是在需要灵活性和可扩展性的应用场景中。
- MongoDB 的文档可以理解为关系型数据库(MySQL)的一行记录。
- MongoDB 将数据记录为 BSON 格式的文档。
- BSON 是 JSON 文档的二进制表示,但它支持的数据类型更加丰富。
MongoDB文档由字段和值对组成,并具有以下结构:
css
{
field1: value1,
field2: value2,
field3: value3,
...
fieldN: valueN
}

MongoDB Bson格式介绍
BSON 是 Binary JSON 的缩写,是一种二进制序列化格式,用于在 MongoDB 中存储文档和进行远程过程调用。它和Json一样,支持内嵌的文档对象和数组对象,但是Bson有Json没有的一些数据类型,如 Date 和 BinData 类型。
JSON vs BSON
JSON的局限性,比如它只有null、布尔、数字、字符串、数组和对象这几种数据类型,没有日期类型,只有一种数字类型,无法区分浮点数和整数,也没法表示正则表达式或者函数。BSON是一种类JSON的二进制形式的存储格式,Binary JSON,支持内嵌的文档对象和数组对象,如 Date 和 BinData 类型,MongoDB 使用 BSON 作为文档数据存储和网络传输格式。
BSON的优势
- 更丰富的数据类型:BSON扩展了JSON的数据类型,支持如日期(Date)、二进制数据(BinData)、对象ID(ObjectId)、正则表达式等,这些类型在JSON中需通过字符串或复杂结构模拟。
- 高效的序列化/反序列化:二进制编码允许快速解析,尤其适合大规模数据操作,减少了文本解析的开销。
- 可遍历性:BSON文档包含长度前缀等元数据,便于快速跳过无关字段,提升查询效率。
BSON的局限性
- 可读性差:二进制格式无法直接阅读,需借助工具转换为JSON进行调试。
- 存储空间:由于包含类型和长度信息,BSON可能比等效的JSON稍大,但效率提升通常抵消了空间成本。
BSON类型介绍
- 官方BSON类型详细介绍:www.mongodb.com/zh-cn/docs/...

下面简单介绍一下其中几个比较重要的类型:
ObjectId:
- 插入一条数据系统都会自动插入一个_id键,键值不可以重复,它可以是任何类型的,也可以手动的插入,默认情况下它的数据类型是ObjectId,由于MongoDB在设计之初就是用作分布式数据库,所以使用ObjectId可以避免不同数据库中_id的重复(如果使用自增的方式在分布式系统中就会出现重复的_id的值)。
- jectId使用12字节的存储空间,每个字节可以存储两个十六进制数字,所以一共可以存储24个十六进制数字组成的字符串,在这24个字符串中,前8位表示时间戳,接下来6位是一个机器码,接下来4位表示进程id,最后6位表示计数器。
MongoDB 采用 ObjectId 来表示主键的类型,数据库中每个文档都拥有一个_id 字段表示主键,_id 的生成规则如下:
其中包括4-byte Unix 时间戳,3-byte 机器 ID,2-byte 进程 ID,3-byte 计数器(初始化随机)。

bash
601e2b6b aa203c c89f 2d31aa
↑ ↑ ↑ ↑
时间戳 机器码 进程id 计数器
String:
BSON 字符串通常为 UTF-8,在对 BSON 进行序列化和反序列化时,每种编程语言的驱动程序都会从该语言的字符串格式转换为 UTF-8,这样就可以轻松地将大多数国际字符存储在 BSON 字符串中。 此外,MongoDB $regex查询在正则表达式字符串中支持 UTF-8。
Timestamps:
BSON 具一种特殊的时间戳类型,供 MongoDB 内部使用,与常规的 Date 类型无关。此内部时间戳类型是 64 位值,其中:
- 最高的 32 位有效位则是 time_t 值(自 UNIX 纪元以来的秒数)。
- 对于给定秒内的操作,最低有效的 32 位是递增的 ordinal。
Date:
BSON Date(BSON 日期)是一个 64 位整数,它表示自 UNIX 纪元(1970 年 1 月 1 日)以来的毫秒数。因此,过去与未来的可表示日期范围便可达到约 2.9 亿年。
MongoDB索引种类
- _id索引: 绝大多数集合默认建立的索引;对于每个插入的数据,mongodb都会自动生成一条唯一的_id字段。
- 单键索引: 不自动创建,值单一,例如字符串,数字或者日期。
- 多键索引: 不自动创建,值有多个,如数组,与单键索引创建形式相同,区别在于字段的值。
- 复合索引: 查询条件不只一个时,需要建立复合索引。
- 过期索引TTL: 是在一段时间后会过期的索引,索引过期后,相应的数据会删除(不仅仅是索引删除,还有数据);适用场景:在一段时间之后会时效的数据,比如用户的登陆信息、存储的日志;建立方法,db.test.ensureIndex({time:1},{expireAfterSeconds:10})秒数。其限制:存储在过期索引字段的值必须是指定的时间类型(ISODate或者其数据,不能使用时间戳,否则不能被自动删除);指定ISODate数组,则按照最小的时间进行删除;过期索引不能是复合索引;删除时间不精确(MongoDB默认60s执行一个删除过程,删除本身也需要时间)
- 全文索引: 对字符串与字符串数组创建全文课搜索的索引。
- 地理位置索引: 将一些点的位置存储在MongoDB中,创建索引后,可以按照位置来查找其他点。
MongoDB GUI可视化工具
俗话说工欲善其事,必先利其器。选择一款高效的GUI可视化客户端管理工具,对于我们的日常开发效率都有大大的提升。下面推荐几款比较好用的MongoDB GUI可视化管理工具!
Studio 3T
Studio 3T是一款专为MongoDB设计的强大可视化工具,旨在帮助开发人员和数据库专业人员更高效地管理和操作MongoDB数据库。
Navicat for MongoDB
Navicat for MongoDB 可简化数据库管理并增强用户与 MongoDB NoSQL 功能的交互。你可以通过响应式用户界面浏览集合和文档、可视化构建聚合管道并执行数据操作。
- 官网下载地址:www.navicat.com.cn/download/na...
- 在 Navicat for MongoDB 使用文档:www.navicat.com.cn/company/abo...
NoSQLBooster
NoSQLBooster 是一款适用于 MongoDB Server 3.6-8.0 的跨平台 GUI 工具,它提供基于 AI 的自然语言查询、MongoDB 脚本调试器、全面的监控工具、流畅查询链、SQL 查询、查询代码生成器、任务调度以及高级智能感应体验。
MongoDB学习路线图
- 原址查看详细描述:roadmap.sh/mongodb
