MongoDB数据关系建模

linuxx 发表于 2018-10-27 06:23:52

　　MongoDB中的数据是非常灵活的，集合中也不强制文档要采用统一的结构。但是认真考虑数据模型依然是非常重要的，因为这会影响到应用程序性能和数据库的能力。本文讲述了MongoDB中常见的一对一、一对多关系模型如如何建模。
　　（1）一对一嵌入式文档模型（Embedded Document Model）
　　假设赞助商和住址是一种一对一关系，赞助商只有一处住址。赞助商可以看成是住址的属性或字段，住址也可以看成是赞助商的一个属性或字段。在类似于这种关系中，使用嵌入式数据模型（Embedded）的好处就是在一次查询中就能得到想要的全部数据，而引用性模型（References）则需要多次查询才能得到想要的数据（姓名和住址）。
　　赞助商和住址之间的关系（References）
　　
　　{
　　_id: "joe",
　　name: "Joe Bookreader"
　　}
　　{
　　patron_id: "joe",
　　street: "123 Fake Street",
　　city: "Faketon",
　　state: "MA",
　　zip: "12345"
　　}
　　赞助商和住址之间的关系（Embeded）
　　
　　{
　　_id: "joe",
　　name: "Joe Bookreader",
　　address: {
　　street: "123 Fake Street",
　　city: "Faketon",
　　state: "MA",
　　zip: "12345"
　　}
　　}
　　（2）一对多嵌入式文档模型（Embedded Document Model）
　　
　　假设赞助商和住址是一种一对多关系，赞助商有多处住址，可以使用引用模型将赞助商当做住址的属性，可以使用嵌入模型将住址当成赞助商的属性。这样的场景适合使用嵌入式模型，一来只有一次查询就能得到想要的所有数据。二来，在一个上下文中就能看到数据数据，结构比较简单。
　　赞助商和住址之间的关系（References）
　　
　　{
　　_id: "joe",
　　name: "Joe Bookreader"
　　}
　　{
　　patron_id: "joe",
　　street: "123 Fake Street",
　　city: "Faketon",
　　state: "MA",
　　zip: "12345"
　　}
　　{
　　patron_id: "joe",
　　street: "1 Some Other Street",
　　city: "Boston",
　　state: "MA",
　　zip: "12345"
　　}
　　赞助商和住址之间的关系（Embeded）
　　
　　{
　　_id: "joe",
　　name: "Joe Bookreader",
　　addresses: [
　　{
　　street: "123 Fake Street",
　　city: "Faketon",
　　state: "MA",
　　zip: "12345"
　　},
　　{
　　street: "1 Some Other Street",
　　city: "Boston",
　　state: "MA",
　　zip: "12345"
　　}
　　]
　　}
　　
　　（三）一对多引用型文档模型（References Document Model）
　　
　　图书出版商和图书之间是一种一对多关系，一个出版本可以初版多本图书，可以一本图书只能由一个出版商发行。在这种情形下，如果我们仍使用嵌入式数据模型，可能会导致数据重复，见下图：
　　{
　　title: "MongoDB: The Definitive Guide",
　　author: [ "Kristina Chodorow", "Mike Dirolf" ],
　　published_date: ISODate("2010-09-24"),
　　pages: 216,
　　language: "English",
　　publisher: {
　　name: "O'Reilly Media",
　　founded: 1980,
　　location: "CA"
　　}
　　}
　　{
　　title: "50 Tips and Tricks for MongoDB Developer",
　　author: "Kristina Chodorow",
　　published_date: ISODate("2011-05-06"),
　　pages: 68,
　　language: "English",
　　publisher: {
　　name: "O'Reilly Media",
　　founded: 1980,
　　location: "CA"
　　}
　　}
　　
　　为了避免出现数据重复，最好的方法是使用引用型数据模型，将图书出版商和初版图书分别保存在不同的集合中。
　　使用引用模型时，引用关系存储在哪一方是由关系之间的数据量决定的。如果出版商的图书增长的非常缓慢，也可以说是每个出版商出版的图书数量有限，可以将关系存储在出版商这边。如下所示：
　　{
　　name: "O'Reilly Media",
　　founded: 1980,
　　location: "CA",
　　books:
　　}
　　{
　　_id: 123456789,

　　>　　author: [ "Kristina Chodorow", "Mike Dirolf" ],
　　published_date: ISODate("2010-09-24"),
　　pages: 216,
　　language: "English"
　　}
　　{
　　_id: 234567890,
　　title: "50 Tips and Tricks for MongoDB Developer",
　　author: "Kristina Chodorow",
　　published_date: ISODate("2011-05-06"),
　　pages: 68,
　　language: "English"
　　}
　　
　　但如果出版商出版的图书数量非常多，这种模型会导致数据模型发生变化，尤其是增长的数组。这时，最好将引用关系存储在图书一方，如下图：
　　{
　　_id: "oreilly",
　　name: "O'Reilly Media",
　　founded: 1980,
　　location: "CA"
　　}
　　{
　　_id: 123456789,
　　title: "MongoDB: The Definitive Guide",
　　author: [ "Kristina Chodorow", "Mike Dirolf" ],
　　published_date: ISODate("2010-09-24"),
　　pages: 216,
　　language: "English",
　　publisher_id: "oreilly"
　　}
　　{
　　_id: 234567890,
　　title: "50 Tips and Tricks for MongoDB Developer",
　　author: "Kristina Chodorow",
　　published_date: ISODate("2011-05-06"),
　　pages: 68,
　　language: "English",
　　publisher_id: "oreilly"
　　}
　　
　　

页: [1]

运维网's Archiver

MongoDB数据关系建模