千万级别数据关于聚合操作的数据统计

Question

20.69K 浏览2018/01/24性能问题

0

zxmajunhong 0 2018/01/24 0条评论

现有一个集合数据量大概1千5百多万条，每天还会不断增加。
数据结构大概这样`{number: ‘1A1001’, visDate: ‘时间’}`，这里面number字段规格为 /^1[A-Z]\d{4}$/，visDate 为时间字段。
我想查询某个时间段中包含A的number字段的并且正对number字段分组获取每种number的总条数。
现在使用aggregate聚合查询，语句如下：
`db.getCollection(‘xxx’).aggregate([
{$match: {number: /^1A/, visDate: {$gte: new Date(‘2017-11-11’), $lt: new Date(‘2018-01-01’)}}},
{$group: {_id: ‘$number’, count: {$sum: 1}}
])`
针对这个集合的number字段有建立索引，但是查阅资料说在经行group聚合操作的时候是不会使用索引的，所以
每次查询结果最低都是5s以上，有没有优化的地方，望大神解答

3 答案

score 0 · Answer 1 · 2018-02-01T02:29:18+00:00

0

mrgreensky@163.com 0 发布 2018/02/01 0 条评论

求解

score 0 · Answer 2 · 2018-01-31T07:06:09+00:00

就上图来开，在查询的时候有命中索引，但是实际查询时间并没有减少多少，我现在由于数据库的问题，现在库里只有一百多万条数据，

查询的时间还是需要1s以上。

score 0 · Answer 3 · 2018-01-31T04:31:39+00:00

你把explain的结果贴出来看下，看看是否有用到你的索引。Group stage操作之后是无法用到索引的，但是之前的就可以，比如说你的$match理论上可以用到索引。

千万级别数据关于聚合操作的数据统计

3 答案

回顶部

关注微信：mongoing-mongoing
复制微信号

提交工单咨询

3 答案

回顶部

关注微信：mongoing-mongoing复制微信号

提交工单咨询

关注微信：mongoing-mongoing
复制微信号