干货教程 | MongoDB 熟练到精通（三）：文档模型设计三步曲之基础建模·上篇

导读：本文为《MongoDB 熟练到精通》系列文章第三篇。该系列内容主要面向开发者，介绍在系统上线之前需要关注的事项，包括如何进行最关键的文档模型设计、读写事务操作，介绍数据安全和事务性等诸多高级参数和特性的含义及使用方式，以及开发者最佳实践。在最基本的数据库增删改查之余，我们更希望通过这部分的学习，让大家有足够的底气把简历上的“熟练使用 MongoDB 进行开发”，改为“精通使用 MongoDB 开发”。下面就让我们一起开启今日份的学习吧。

通过上一篇内容，我们已经初步了解了 MongoDB 学习中的一大难点——模型设计。现针对这个问题，整理总结出了可供参照跟学的方法论三步曲，帮助大家速通文档模型设计。

MongoDB 文档模型设计三步曲

上图展示了 MongoDB 文档模型设计三部曲的具体内容：基础建模、工况细化、套用设计模式。

第一步，基础建模：此时的输入来自于概念模型或逻辑模型。默认大家已经完成了针对业务需求的分析，并建立逻辑模型，明确其中的实体、表、关系等。在此基础之上，将其转化为物理的 JSON 模型，用集合或字段表现出一个基础形状。

第二步，工况细化：在第一步的基础上，进一步讨论业务完成后的具体技术需求，包括读写比例、数量等，并据此对模型进行细化和优化，使用引用和关联的方式。

第三步，套用设计模式：这一步主要基于经验或学习来达成。通过借用已有的成熟设计模式，将模型进一步优化到最终版本。

本篇我们将重点学习第一步，掌握如何建立基础文档模型，也就是历史文章中提到的三层建模中的物理模型过程。

第一步：建立基础文档模型

物理模型建立的前提是逻辑模型的输入，也即根据概念模型或业务需求推导出逻辑模型，并找到逻辑模型的对象（实体），明确实体之间的关系及基数。需要强调的是，这里的关系还包含一对一、一对多和多对多，也要分别列出。满足上述前提条件之后，就可以套用逻辑设计原则，来决定如何组织我们的 JSON 文档，并最终完成基础模型的构建。

举个例子

已知具体分步，下面就可以代入需求，依次对照模拟操作。仍然以我们的联系人管理应用为例：

① 找到实体对象：包含联系人、分组、地址、头像、电话等。

② 明确其间关系：以联系人与头像、地址，以及分组这三者的关系为例，可以如下列出：

一个联系人有一个头像（1-1）
一个联系人可以有多个地址（1-N）
一个联系人可以属于多个组，一个组可以有多个联系人（N-N）

详解三种关系建模

1-1 关系建模：以 Contacts-Portraits 为例

1-1 在三种关系建模里相对简单，例如联系人和头像的关系。在 JSON 文档模型设计里，基本原则为：一对一的物理关系建模以内嵌为主，也就是将信息直接作为子文档形式，放在 JSON 母文档里，或者直接在顶级，不涉及到数据冗余。参照上图，无论头像属性有几个字段，包括图像二进制 mimetype、data ，都可以直接放到 Contacts 联系人母文档之中。MongoDB 也支持直接把二进制内容放到 JSON 文档里，不需要额外处理。这样我们就可以通过简单内存，只需要一张表，就得到了一个一对一的关系。

不过需要留意一类例外情况：对于 MongoDB 而言，文档最大限制为 16MB，所以如果内嵌后导致文档大小超过 16MB，这条原则就不太适用了（基础建模阶段，仅需了解这一限制，不用过分关注）。

1-N 关系建模：以 Contacts-Addresses 为例

类似于 1-1 关系建模，一对多关系在 MongoDB 的 JSON 文档模型设计中，同样以内嵌为主，可以以子文档方式存入，只不过因为涉及到多个元素，1-N 关系建模用数组来表示一对多关系。参照上图中联系人与地址的关系，联系人地址不唯一，符合 1-N 情境，仍然直接将 addresses 子文档字段嵌入 Contacts 母文档，字段内是一个数组，数组包含多个元素，分别是 home 家庭地址，以及 work 工作地址。通过这种方式，完美表示一个联系人可以有多个地址的关系，并且没有额外生成新表，还是一个 JSON 文档。

当然同样也会面临一些例外状况，像是数组太大，文档超过 16MB，或是长度不确定等，这些问题我们会在之后的内容中一一讲解，本篇重点关注内嵌原则。

N-N 关系建模：以 Contacts-Groups 为例

前面的内容里，我们已经了解到传统方式的 N-N 关系建模，通常用映射来表示两个实体间的 N-N 关系。但在 MongoDB 中，则无需诉诸此类关联或映射表，仍然可以通过内嵌方式来直接或间接表示，一般会用内嵌数组来表示一对多，通过冗余来实现 N-N。

参照上图，假设我们将联系人分为 Friends 组和 Surfers 组，同样可以放入母文档，如此在看到联系人的同时也获得了对应的分组信息。诚然，这种方式会出现很多冗余。但在 MongoDB 的设计中，冗余并不是“一定不可以”的存在，很多时候更是被允许甚至鼓励的。当然，这也要结合实际情况来分析，但至少在基础模型设计的第一个阶段，在没有例外情况的前提下，我们还是可以先按照这种方式把模型简单地构建好，留待后续进一步优化。

小结

到这里，大家应该不难看出，对于 MongoDB 而言，内嵌确实是建模的一大法宝及主要手段，这也是我们本篇的内容核心：基础建模本质上就是对关系的各种表达，包括一对一、一对多，以及多对多。在 MongoDB 中，基本都可以用内嵌数组的方法来完成这些关系的表述。

下一篇章我们将重点学习三步曲的第二步，工况细化，了解如何用引用或者关联来处理一些特定场景的问题。

【关联阅读】

⭐️ 碰上 MongoDB 使用问题？想要寻求更多咨询及运维帮助？这里有：

干货教程 | MongoDB 熟练到精通（三）：文档模型设计三步曲之基础建模·上篇

xiaomangguo

相关推荐

评论抢沙发

评论前必须登录！

强力推荐

中文社区公众号

MongoDB 同步/迁移工具

友情链接

回顶部

关注微信：mongoing-mongoing
复制微信号

提交工单咨询