使用MongoDB进行分片

• 新部署是否适合进行分片?

• 在对集合进行分片后是否可以更改片键?

• 为什么文档没有分布到各个分片?

• mongos是如何检测到分片集群配置更改的?

• 日志中出现的writebacklisten是什么意思?

• mongos是如何使用连接的?

本文档回答了有关分片的常见问题。或者可以参考手册的分片章节,其提供了 分片的概述,包括如下细节:

• 片键和选择片键的注意事项

• 查询路由

• 高可用性

• 数据分块(Chunk)和数据块(Chunk)迁移过程

对分片集群进行故障排除

新部署是否适合进行分片?

有时是适合的。但是,如果您的数据集适合放在单个服务器,则应该以非分片部署作为分开始,因为数据集很小,分片几乎没有优势。

在对集合进行分片后是否可以更改片键?

不可以。

MongoDB中没有对集合分片后更改片键的自动支持。这一现实情况强调了选择好的片键的重要性。如果在集合分片后必须更改片键,最佳选择是:

• 将MongoDB中的所有数据转储为外部格式。

• 删除原始分片集合。

• 使用更理想的片键配置分片。

• 预分割(pre-split)片键范围以确保初始均匀分布。

• 将转储的数据恢复到MongoDB中。

也可以参考:
片键

为什么文档没有分布到各个分片?

一旦数据块(chunk)的分布达到某个阈值,均衡器就开始在分片上迁移均衡数据。请参阅 迁移阈值

此外,如果块中的文档数超过一定数量,MongoDB将无法移动块。请参阅 每个要迁移的块的最大文档数不可分割的块

mongos是如何检测到分片集群配置更改的?

mongos实例维护配置数据库(config)的缓存,该缓存包含分片集群的元数据。

mongos通过向分片发出请求并发现其元数据已过期来懒更新其缓存。要强制 mongos重新加载其缓存,可以对每个mongos 直接执行flushRouterConfig命令。

日志中出现的writebacklisten是什么意思?

回写监听器(writeback listener)是一个进程,它打开一个长轮询,在迁移之后从mongodmongos将写入取回,以确保它们没有进入错误的服务器。如有必要,回写监听器会将写入发送回正确的服务器。

这些消息是分片的基础关键部分,不需要引起关注。

(译者理解:写入数据根据片键发送到对应分片mongod,但到达时发现对应chunk已经迁移到其他分片mongod了,回写监听器监听到这种情况,就会把数据取回到mongos,然后再发往正确的mongod。这一些列动作,对用户来说都是透明的,所以不用关注)

mongos是如何使用连接的?

每个mongos实例都维护一个与分片集群成员的连接池。客户端请求一次使用一个连接; 即请求不是多路复用或流水线化的。

客户端请求完成后,mongos将连接归回到连接池。当客户端数量减少时,这些池不会收缩。这可能导致未使用的mongos占用大量打开的连接。如果mongos不再使用,则可以安全地重新启动进程以关闭现有连接。

要返回mongos所使用的所有对外连接池相关的聚合统计信息,请将mongo shell 连接 到mongos,然后运行 connPoolStats命令:

db.adminCommand (“connPoolStats” );
请参阅UNIX ulimit设置 文档的“ 系统资源利用率”部分。

译者:钟秋

原文链接:https://docs.mongodb.com/manual/faq/sharding/

发表评论