MongoDB常用命令和性能优化

一、基础概念

MongoDB 采用文档型存储，其数据模型灵活且自带结构层次。要理解 MongoDB 的结构，首先需要了解其核心概念：文档（Document）、集合（Collection）和数据库（Database），以及它们在 MongoDB 数据模型中的应用。

1.1 数据模型

文档（Document）：

文档是 MongoDB 中的最小数据单元，以键值对的形式组织，类似于 JSON 对象（实际上是 BSON，即 Binary JSON）。

示例：

复制代码

{
  "_id": "12345",
  "name": "Alice",
  "age": 30,
  "interests": ["reading", "sports"],
  "address": {
    "city": "New York",
    "zip": "10001"
  }
}

集合（Collection）：

集合是文档的逻辑分组，类似于关系型数据库中的表。集合内的文档结构可以有所不同，这给 MongoDB 带来了极大的灵活性。

数据库（Database）：

数据库是 MongoDB 中存储数据的最高逻辑单位，一个数据库可以包含多个集合。

与关系型数据库的对比：

在关系型数据库中，数据以表的形式存在，表的列定义了数据的结构；而在 MongoDB 中，文档的结构可以灵活变化。
由于 MongoDB 的文档可以包含嵌套对象和数组，避免了多表关联的复杂性，在处理层次化数据时更高效。

MongoDB 的文档模型优势：

假设我们有一个用户的关系型数据库，用户有兴趣爱好表、地址表，查询用户和其兴趣爱好需多次关联。MongoDB 则可以将兴趣爱好等信息直接存储在用户文档中，使得读取速度更快，代码更简单。

1.2 数据类型

MongoDB 支持多种数据类型，包括基本数据类型和复杂数据类型：

基本类型：字符串（String）、整数（Int32、Int64）、布尔值（Boolean）、浮点数（Double）、日期（Date）等。
复杂类型：数组（Array）、对象（嵌套文档 Document）、Null 类型等。

日期类型存储与操作

MongoDB 提供了 Date 类型来表示日期。可以使用 ISODate() 创建日期数据：

复制代码

{
  "_id": "12345",
  "name": "Alice",
  "joined": ISODate("2023-01-01T00:00:00Z")
}

查询日期数据时，可以使用 $gt、$lt 等操作符：

复制代码

db.users.find({ joined: { $gt: ISODate("2023-01-01T00:00:00Z") } });

注意事项：

日期存储为 UTC 时间，展示和查询时需根据时区调整。
日期查询时使用 UTC 格式，以确保准确性。

二、数据库操作

2.1 数据库管理操作

MongoDB 不需要手动创建数据库，默认会在第一次存储数据时自动创建。但我们也可以通过显式的 use 命令切换到指定数据库：

复制代码

use myDatabase  // 切换到 myDatabase 数据库，不存在则创建

2.2 集合管理操作

集合类似于关系型数据库中的表。MongoDB 会在第一次插入文档时自动创建集合，但也可以显式创建集合，以便进行自定义配置：

复制代码

// 创建集合并指定最大文档数和文档大小（以字节为单位）
db.createCollection("myCollection", {
   capped: true,   // 固定大小集合
   size: 5242880,  // 最大文档大小 5MB
   max: 5000       // 最多允许 5000 条记录
})

2.3 索引操作

索引用于提高查询效率。可以使用单字段索引、复合索引、文本索引等，以下是一些常见的索引创建示例：

复制代码

// 单字段索引
db.myCollection.createIndex({ name: 1 })

// 复合索引
db.myCollection.createIndex({ age: 1, name: -1 })

// 文本索引
db.myCollection.createIndex({ description: "text" })

2.4 CRUD 操作详细解读

CRUD 是 MongoDB 中的核心操作，包含插入、读取、更新和删除等。以下将逐一讲解这些操作。

插入操作

插入操作可以使用 insertOne 和 insertMany 方法：

复制代码

// 插入单个文档
db.myCollection.insertOne({ name: "Alice", age: 30 })

// 插入多个文档
db.myCollection.insertMany([{ name: "Bob", age: 25 }, { name: "Charlie", age: 35 }])

查询操作

MongoDB 提供了灵活的查询语法，支持条件查询、复杂查询、聚合查询等：

简单查询

查询 age 等于 25 的文档：
复制代码
```
db.myCollection.find({ age: 25 })
```

复杂查询

使用 $and 和 $or 操作符：

复制代码

db.myCollection.find({
   $and: [{ age: { $gte: 25 } }, { age: { $lte: 30 } }]
})

查询 age 大于 25 且 name 包含 "A"的文档：

复制代码

db.myCollection.find({
   age: { $gt: 25 },
   name: { $regex: /A/ }
})

排序和分页
- 排序：使用 sort 方法按年龄降序排序：
  复制代码
```
db.myCollection.find().sort({ age: -1 })
```
- 分页：使用 limit 和 skip 实现分页查询，第 2 页，每页 5 条：
  复制代码
```
db.myCollection.find().skip(5).limit(5)
```
聚合查询

聚合查询通常用于数据统计和分析，如平均值、总和等，以下是一些示例：
- 使用
  复制代码
```
$match
```
  和
  复制代码
```
$group
```
  聚合操作符查询年龄分组的平均值：
  复制代码
```
db.myCollection.aggregate([
   { $match: { age: { $gte: 20 } } },
   { $group: { _id: "$age", averageAge: { $avg: "$age" } } }
])
```

更新操作

更新操作包括单文档更新和多文档更新，可以使用 $set、$inc 等操作符。默认情况下，updateOne 仅更新第一个匹配的文档，而 updateMany 则会更新所有符合条件的文档：

复制代码

// 更新单个文档，将 age 设置为 40
db.myCollection.updateOne({ name: "Alice" }, { $set: { age: 40 } })

// 更新多个文档，将 age 增加 1
db.myCollection.updateMany({ age: { $lt: 40 } }, { $inc: { age: 1 } })

删除操作

删除操作包括 deleteOne 和 deleteMany，分别删除一个或多个符合条件的文档：

复制代码

// 删除单个文档
db.myCollection.deleteOne({ name: "Bob" })

// 删除多个文档
db.myCollection.deleteMany({ age: { $lt: 25 } })

三、索引

3.1 索引的概念和作用

MongoDB 的索引用于加速查询。创建索引后，MongoDB 可以跳过不符合条件的数据，大幅提升查询速度。

3.2 索引的类型和创建

索引类型：

单字段索引：对单个字段创建索引。
复合索引：对多个字段创建索引。

创建索引：

复制代码

db.collection("users").createIndex({ "name": 1 });

3.3 设置数据有效期（TTL 索引）

在实际应用中，有些数据可能只需要保留一段时间，之后可以自动删除。MongoDB 提供了 TTL（Time-To-Live）索引，用于自动删除超过指定时间的文档。

使用 TTL 索引

可以在集合中创建一个 TTL 索引，使得 MongoDB 自动删除超出生存时间的文档。以下为设置 TTL 索引的示例。

定义带有日期字段的文档：我们通常会定义一个文档，其中包含一个表示文档创建时间的日期字段。
复制代码
```
{
  "_id": ObjectId("..."),
  "name": "SessionData",
  "createdAt": new Date() // 文档创建时间
}
```
创建 TTL 索引 ：在 createdAt 字段上设置 TTL 索引，并定义文档的存活时间（单位为秒）。
复制代码
```
db.collection("sessions").createIndex({ "createdAt": 1 }, { expireAfterSeconds: 3600 });
```
以上配置表示：文档将在创建后 3600 秒（即 1 小时）后自动删除。

TTL 索引注意事项

TTL 索引只对 Date 类型字段有效。
TTL 索引的清理操作每 60 秒执行一次，因此文档可能会在过期后稍有延迟才被删除。

四、数据备份与恢复

4.1 备份策略与工具

MongoDB 提供了 mongodump 工具进行备份。以下是基本用法：

复制代码

mongodump --out /backup/mongodata

4.2 恢复操作

可以使用 mongorestore 工具从备份文件恢复数据：

复制代码

mongorestore --dir /backup/mongodata

五、性能优化

在实际应用中，MongoDB 的性能优化至关重要，尤其是在处理大量数据或频繁的读写操作时。我们将从查询优化、索引优化、写入优化和存储优化四个方面详细探讨如何提升 MongoDB 的性能。

5.1 查询性能优化

MongoDB 查询优化的主要策略是减少数据量、减少数据库扫描、并提高查询的执行效率。

优化查询语句 ：避免不必要的查询字段，可以通过 .projection() 仅返回所需字段。

示例：

复制代码

// 查询用户年龄大于25岁的文档，仅返回姓名字段
db.collection("users").find({ "age": { $gt: 25 } }, { "name": 1 });

限制返回数据 ：对于查询结果较大的操作，可以使用 .limit()、.skip() 进行分页，减少单次查询的数据量。

示例：
复制代码
```
// 查询前20个年龄大于25岁的用户，分页获取
db.collection("users").find({ "age": { $gt: 25 } }).limit(20).skip(20);
```
explain() 方法分析查询性能 ：通过 explain() 方法查看查询的执行计划和统计信息，以找出性能瓶颈。

示例：
复制代码
```
db.collection("users").find({ "age": { $gt: 25 } }).explain("executionStats");
```
explain() 输出包括扫描的文档数、实际查询时间等关键指标，根据这些信息调整索引和查询条件能有效提升性能。

5.2 索引优化

索引可以显著提高查询速度，但不合理的索引使用或过多的索引可能会降低写入性能。

定期评估索引使用情况 ：通过 db.collection.stats() 查看索引使用情况，根据查询频率和数据增长情况定期评估并调整索引。
避免过多索引：对于只进行少量查询的字段避免创建索引，以免在插入或更新操作中增加额外的负担。

5.3 写入性能优化

写入性能在数据增长迅速的场景中尤为关键。

批量插入数据：MongoDB 提供批量写入 API，可以将多个插入操作合并为一次请求，减少网络延迟。

示例：
复制代码
```
db.collection("users").insertMany([
    { "name": "Alice", "age": 30 },
    { "name": "Bob", "age": 25 }
]);
```
适当调节写入确认模式：MongoDB 支持不同的写入确认模式。对于对数据一致性要求不高的应用，可以将写入模式设置为"acknowledged"以提高性能。

5.4 存储性能优化

对于数据量较大且历史数据查询需求较低的场景，存储性能优化是提高数据库整体效率的重要措施。以下是 MongoDB 存储性能优化的关键方法：数据分片和数据压缩。

数据分片（Sharding）

数据分片 是 MongoDB 的一项强大功能，允许将大型集合分割为更小的片段（称为 shards），这些片段分布在多个节点上。这样可以通过将负载分散到不同节点，显著降低单个节点的存储和查询压力。

分片原理：MongoDB 使用分片键（shard key）来划分数据。分片键可以是单字段或复合字段，通过特定的分片策略（范围分片或散列分片）将数据分散到各个分片中。
分片策略：
- 范围分片：根据分片键的值范围划分数据，例如可以按日期、用户ID等字段进行分片，适合有顺序查询需求的场景。
- 散列分片：通过对分片键进行哈希运算，将数据均匀地分配到不同分片中，适用于分片键随机分布的场景。

示例：配置 MongoDB 分片

以下是一个配置分片的示例，以日期字段为分片键，适用于分片的日志集合：

创建分片集合：

复制代码

// 使用日期字段作为分片键
sh.enableSharding("myDatabase")  // 启用数据库分片
sh.shardCollection("myDatabase.logs", { logDate: 1 })  // 按日期分片

数据分片策略选择：如果分片键是随机分布的数据（如用户ID），可以选择散列分片：
复制代码
```
jsh.shardCollection("myDatabase.userRecords", { userID: "hashed" })  // 散列分片
```

注意事项：

合理选择分片键至关重要。避免使用低基数字段（例如布尔值）作为分片键，因为这会导致分片不均衡。
如果选择范围分片，确保分片键字段的数据在查询时有明确的上下限。

数据压缩（Data Compression）

数据压缩是在存储空间有限、对存储成本敏感的场景下，减少物理存储空间占用的重要方式。MongoDB 提供了不同的压缩选项，用于集合和索引的压缩。

压缩选项

：MongoDB 提供了
复制代码
```
snappy

zlib
```
等压缩算法，可以在集合创建时指定。例如：
- snappy：轻量级、速度较快，适合查询较多的集合。
- zlib：压缩效果更好，但会增加一定的查询时间。

示例：创建带压缩的集合

可以在创建集合时启用压缩选项，以下示例中启用了 zlib 压缩：

复制代码

db.createCollection("largeCollection", {
   storageEngine: {
      wiredTiger: {
         configString: "block_compressor=zlib"  // 使用 zlib 压缩
      }
   }
})

压缩配置示例

对于特定索引，可以选择使用不同的压缩算法，例如 snappy：

复制代码

db.largeCollection.createIndex({ "field": 1 }, {
   storageEngine: {
      wiredTiger: {
         configString: "block_compressor=snappy"  // 为索引启用 snappy 压缩
      }
   }
})

注意事项：

启用压缩可能会增加读取开销，因此在数据写入较多、查询较少的场景更适用。
若对压缩需求高且查询频繁，可以选择 snappy 压缩，以在查询速度与存储节省之间取得平衡。