19.91K 浏览2015/04/22驱动程序 0 milowang0 2015/04/22 0条评论 我们是生物方面的应用,要往Gridfs里存放fasta序列文件,现在为了查询方便,我们预计会拆出30亿个fasta的文件,如果顺序导入会很慢,大概7分钟150万个文件,能不能并行的,或者多线程的方法,快速将大量文件导入Gridfs中? 1 答案 活跃已投票最新最老的 0 TJ130 发布 2015/04/26 1 条评论 1) 在导入脚本里用unordered bulk insert的方式批量插入,并使用多线程 2)如果使用mongoimport,3.0版本中工具本身就支持多线程方式, 你也可以同时执行多个mongoimport进程 3)如果你想进一步提高写入量,则要使用分片来提供并发率。可以考虑使用手工分片的方式来防止数据均衡影响插入性能。不过如果你的导入是一次性的,那就不一定划算。因为使用分片各种成本较高。 milowang 已评论 2015/04/27 好的,谢谢,我想我们先试试3.0 您正在查看1个答案中的1个,单击此处查看所有答案。 注册 或 登录
好的,谢谢,我想我们先试试3.0