MongoDB 教材
MongoDB 是一个开源的 NoSQL 数据库,以其高性能、高可用性和自动扩展性广受欢迎。本文将详细介绍 MongoDB 的体系结构、语法、底层原理、开发使用方法及常见使用场景。
目录
MongoDB 简介
MongoDB 是一个面向文档的 NoSQL 数据库,数据以 BSON(二进制 JSON)格式存储。它提供了灵活的数据模型,适合处理大规模数据和高并发访问的应用场景。
MongoDB 体系结构
MongoDB 的体系结构包含以下几个关键组件:
- 数据库(Database):多个集合(Collection)的集合。
- 集合(Collection):多个文档(Document)的集合。
- 文档(Document):MongoDB 中的基本数据单位,以 BSON 格式存储。
- 分片(Sharding):将数据水平切分到多个服务器上,以实现扩展性和高性能。
- 复制(Replication):通过主从复制保证数据的高可用性和可靠性。
MongoDB 的体系结构如下图所示:
+------------------+
| MongoDB Server |
+------------------+
| |
| |
+-----+ +-----+
| DB1 | | DB2 |
+-----+ +-----+
| |
+----+ +----+
|C1 | |C2 |
|C2 | +----+
+----+ |
|
+----+
|D1 |
|D2 |
+----+
MongoDB 语法
基本操作
- 插入文档
javascript
db.collection.insertOne({ name: "Alice", age: 25 });
db.collection.insertMany([{ name: "Bob", age: 30 }, { name: "Charlie", age: 35 }]);
- 查询文档
javascript
db.collection.find({ name: "Alice" });
db.collection.find({ age: { $gt: 25 } });
- 更新文档
javascript
db.collection.updateOne({ name: "Alice" }, { $set: { age: 26 } });
db.collection.updateMany({ age: { $gt: 25 } }, { $inc: { age: 1 } });
- 删除文档
javascript
db.collection.deleteOne({ name: "Alice" });
db.collection.deleteMany({ age: { $lt: 30 } });
高级查询
- 投影
javascript
db.collection.find({ age: { $gt: 25 } }, { name: 1, _id: 0 });
- 排序
javascript
db.collection.find().sort({ age: -1 });
- 分页
javascript
db.collection.find().skip(10).limit(5);
聚合操作
MongoDB 提供强大的聚合框架,支持复杂的数据处理流程。
javascript
db.collection.aggregate([
{ $match: { status: "A" } },
{ $group: { _id: "$cust_id", total: { $sum: "$amount" } } },
{ $sort: { total: -1 } }
]);
底层原理
MongoDB 使用多种技术来保证其高性能和高可用性:
- 存储引擎:MongoDB 默认使用 WiredTiger 存储引擎,支持文档级并发控制和压缩。WiredTiger 提供了高效的读写性能和数据压缩功能,能够显著减少存储占用。
- 内存映射文件:MongoDB 将数据文件映射到内存中,以提高数据访问速度。这种机制利用操作系统的虚拟内存管理,将常用数据页保存在内存中,减少磁盘 I/O。
- 索引:MongoDB 支持多种索引类型,如单字段索引、复合索引、地理空间索引、全文索引等,能够显著提高查询性能。索引使用 B 树结构,提供高效的查找、插入和删除操作。
- 复制集(Replica Set):MongoDB 通过复制集实现数据的高可用性和容错能力。复制集包含一个主节点和多个从节点,主节点负责处理写操作,从节点负责同步数据和处理读操作。
- 分片(Sharding):MongoDB 通过分片实现水平扩展,将数据分布到多个服务器上。分片键用于决定数据如何分布,每个分片存储数据的一部分,协调节点负责路由请求到相应的分片。
开发使用
安装与配置
- 安装 MongoDB
在 Linux 系统上可以通过包管理器安装 MongoDB,例如在 Ubuntu 上:
bash
sudo apt-get update
sudo apt-get install -y mongodb
在 Windows 系统上,可以下载 MongoDB 安装包并运行安装程序。
- 启动 MongoDB
安装完成后,可以使用以下命令启动 MongoDB 服务:
bash
sudo service mongodb start
- 配置文件
MongoDB 的配置文件通常位于 /etc/mongodb.conf
。可以在配置文件中设置数据目录、日志文件路径、网络绑定地址等。
基本 CRUD 操作
- 插入数据
javascript
// 插入单个文档
db.collection.insertOne({ name: "Alice", age: 25 });
// 插入多个文档
db.collection.insertMany([{ name: "Bob", age: 30 }, { name: "Charlie", age: 35 }]);
- 查询数据
javascript
// 查询所有文档
db.collection.find();
// 查询符合条件的文档
db.collection.find({ age: { $gt: 25 } });
- 更新数据
javascript
// 更新单个文档
db.collection.updateOne({ name: "Alice" }, { $set: { age: 26 } });
// 更新多个文档
db.collection.updateMany({ age: { $gt: 25 } }, { $inc: { age: 1 } });
- 删除数据
javascript
// 删除单个文档
db.collection.deleteOne({ name: "Alice" });
// 删除多个文档
db.collection.deleteMany({ age: { $lt: 30 } });
索引与优化
- 创建索引
javascript
// 创建单字段索引
db.collection.createIndex({ name: 1 });
// 创建复合索引
db.collection.createIndex({ name: 1, age: -1 });
- 查看索引
javascript
// 查看集合中的所有索引
db.collection.getIndexes();
- 删除索引
javascript
// 删除指定索引
db.collection.dropIndex("index_name");
// 删除所有索引
db.collection.dropIndexes();
复制与分片
- 设置复制集
配置文件中添加复制集名称:
yaml
replication:
replSetName: "rs0"
启动 MongoDB 实例后,初始化复制集:
javascript
rs.initiate();
添加从节点:
javascript
rs.add("hostname:port");
- 设置分片
启动配置服务器和分片服务器:
bash
mongod --configsvr --replSet configReplSet --port 27019 --dbpath /data/configdb
mongod --shardsvr --replSet shardReplSet --port 27018 --dbpath /data/sharddb
启动路由服务器:
bash
mongos --configdb configReplSet/hostname:27019
添加分片:
javascript
sh.addShard("shardReplSet/hostname:27018");
启用集合分片
javascript
sh.enableSharding("myDatabase");
sh.shardCollection("myDatabase.myCollection", { shardKey: 1 });
使用场景
MongoDB 由于其灵活的数据模型、高性能和可扩展性,适用于多种应用场景:
- 内容管理系统(CMS):由于数据结构灵活,MongoDB 非常适合用于内容管理系统,可以轻松处理复杂的内容类型和关系。
- 实时分析:MongoDB 的高性能读写能力和聚合框架非常适合实时分析和数据挖掘应用,例如点击流分析、用户行为分析等。
- 物联网(IoT):MongoDB 可以处理大量的传感器数据和设备日志,支持高吞吐量和低延迟的数据写入。
- 电商平台:电商平台需要处理大量的产品信息、用户数据和交易记录,MongoDB 的文档模型可以灵活地适应多变的数据结构。
- 社交网络:MongoDB 可以快速存储和检索用户生成的内容,如帖子、评论、点赞等,支持高并发的读写操作。
- 游戏应用:游戏应用需要处理大量的用户数据和游戏状态,MongoDB 的高可用性和扩展性可以满足游戏应用的需求。
注意
MongoDB 是一个功能强大且灵活的 NoSQL 数据库,适用于多种应用场景。本文介绍了 MongoDB 的体系结构、基本操作、底层原理以及常见的开发和使用方法。通过掌握这些知识,开发者可以充分利用 MongoDB 的优势,构建高性能、高可用的应用系统。