背景
某运营商搭建了一套 MongoDB 集群,承载了大大小小的几十个非计费类应用,1亿左右的用户量,随着访问量的增加,业务繁忙时期偶尔出现连接拒绝的错误。
分析
为了搞清楚原因,先从mongo访问数据库的模式说起,如下图:
我们发现客户端的请求是通过驱动连接到mongos或mongod的。
如果有多个实例化的MongoClient,那么就会有多个对应的连接池。
通过调试看到MongoClient的连接池大小默认值为100。可以在代码里面通过MaxConnectionPoolSize属性来修改默认值。
但mongod或mongos能支持的最大并发访问连接数还与服务端实例上的maxConn这个参数有关。
连上实例后通过命令:db.serverStatus().connections可以查看这个参数值,如下图所示输出:
Current表示当前到实例上正在运行的连接数。
Available表示当前实例还可以支持的并发连接数。
TotalCreated表示当前实例从启动到现在一共创建的连接数,包括历史已经关闭了的。
也就是说此mongod或mongos最大能支持的并发连接数为:Current+available=819.
那这个819是怎么来的?
它其实是由maxIncomingConnections (4.0版本里面参数名改为maxConn)和操作系统单个进程能打开的最大文件描述符数总量的80%决定的,取两个之间的最小值。
可以看到单个进程能打开的最大文件描述符数为1024,1024*80% = 819.2 取整数819.
而maxConn参数的默认值65536.
所以最大可以支持的并发连接数为819,刚好等于前面的current+available.
验 证
为了模拟出生产环境的错误,首先将参数maxConn设置为10,也就是让服务器mongod或mongos最大支持10个并发,配置文件修改如下:
通过命令检查最大并发连接确实变为10,如下:
下面写一段代码测试,目的是模拟多线程请求,并发线程为29个,驱动连接池设为20,MongoClient设为“单例”模式,如下:
可以看到当并发的连接到达10个后,第11个连接被拒绝了。因为服务端此时设置的maxConn就为10.
下面再次修改服务器上的maxConn参数为100,其它参数不变,测试第二个场景。
程序和上面一样,执行后的日志输出如下,可以看到通过修改服务端的连接数参数maxConn,客户端的20个并发线程都可以成功连接到mongod实例。
最后测试一个场景:将连接池大小设为5,其它参数不变,并发线程还是为20,服务端maxConn还是100.
运行上面代码,执行输出日志如下:
同时监控服务端连接数:
可以看到只打开了6个连接,说明受连接池大小的约束。
总 结
1.mongod或mongos支持的最大并发连接数受操作系统ulimit(可通过/etc/security/limits.conf文件来配置)和服务端maxConn参数限制,取其中较小值,这两个参数均可调整。
2.如果客户端连接数超过mongod或mongos最大并发数, 会导致超过的连接请求被refused。
3.每个mongoClient会维护一个连接池,客户端的请求会通过连接池连接到mongod或mongos, 如果并发客户端请求数超过了连接池MaxConnectionPoolSize大小, 服务端mongod或mongos最多只打开MaxConnectionPoolSize个连接。其中某些连接会为多个客户端请求服务。
作者简介:
郭远威,大数据资深顾问,MongoDB中文社区联席主席。数据库专家,曾负责迁移英国第一大虚拟运营商; 负责实施了Afrimax集团在非洲多国的BI大数据系统,现负责策划电信领域大数据解决方案。著有《大数据存储MongoDB实战指南》一书。
文章写的真详细。另外多问一句,现在在使用mongo的时候遇到了一点问题。当前mongo驱动版本是3.2.2,当应用服务器启动后,第一次操作mongo时耗时很久,第二次就比较短(最近的测试数据是第一次耗时180ms,第二次是5ms)。而且写入和查询操作都是这种问题。请问下排查问题的思路,多谢!!
文章写的真详细。
最近在选型MongoDB做LBS系统的存储方案,做压测的时候,模拟高并发,就发现有这种情况出现,通过db.serverStatus().connections查看,确实是链接占满