12.56K 浏览2021/05/11分片 0 suncx12 2021/04/12 0条评论 有一张10亿条数据的费用明细表,表内字段为主键,身份证号、姓名,创建时间等等,查询条件为身份证号和姓名,前期集中入库,后期查询,3台机器的分片集群,请问该表片键该如何选择?片键选择主键hash,还是区域(身份证号+姓名)还是其他?请大神指点? xiaoxu 已回答的问题 2021/05/11 1 答案 活跃已投票最新最老的 1 xiaoxu1.13K 发布 2021/05/11 0 条评论 使用主键hash存在的问题: 1、能够将数据均衡分布在各个分片,数据插入的性能能够提升–优势 2、但查询的时候是根据身份证和姓名来查询,那么这个时候查询与更新是广播下发,性能不好且更新如果是单条更新,必须带完整分片键。–那么查询与更新必须改造。 身份证号+姓名使用范围分片: 1、查询根据下发到单个分片,这个性能应该是最优的。 因为身份证本身就是唯一,如果身份证的记录是低频,可以考虑使用身份证使用hash分片即可。 如果每次都是身份证+姓名=身份证来标识一条记录。 xiaoxu 已回答的问题 2021/05/11 注册 或 登录