【后端面试题】【中间件】【NoSQL】MongoDB的优点和分片机制

为什么要用MongoDB

两个关键：灵活性和横向扩展能力

MongoDB是灵活的文档模型，也就是说，如果预计我的数据可以被一个稳定的模型来描述，会倾向于使用MySQL等关系型数据库。而一旦我认为我的数据模型会经常变动，比如我很难预料到用户会输入什么数据，这种情况下更加倾向于使用MongoDB。
MongoDB更容易进行横向扩展。虽然关系型数据库也可以通过分库分表来达成横向扩展的目标，但是扩展和运维都比MongoDB要困难复杂的多，而这一切在MongoDB里都是自动的，你基本上不需要操心。

当下，跟数据存储和检索有关的中间件基本上都会支持分片，或者步入分布式时代后诞生的中间件，基本都会考虑分片机制。

在MongoDB里，可以使用所谓的分片集合（collection）。每一个分片集合都被分成若干个分片，如果按照关系型数据库分库分表的说法，那么集合就是逻辑表，分片就是物理表。每个分片又由多个块（chunk）组成，在最新版本的默认情况下，一个块的大小是128MB

如果一个块满足了下面的任何一个条件，就会被拆分成两个块，简单来说就是数据太多或文档太多：

举个例子，如果一个集合里面最大的分片有9个块，最少的集合有7个块，就会触发再平衡。假设我们要迁移块A，过程如下：

整个过程和别的中间件的数据迁移过程都差不多