分库:是将一个数据库分成多个数据库,但是总表数不变,部署到不同机器,这样可以分担数据库的读写压力,提高系统的吞吐能力。
分表:就是一个表分成多个表,但是总体的库不变,这样可以减少单个表的数据量,提高查询性能。
分库+分表是指库和表都切分,数量都发生变化,这种情况说明数据量已经达到一定程度,无论进行哪种单独的切分都会产生性能瓶颈。 如下图所示原数据库DB中有张user表,将表切成4份然后平分到2个数据库上。
可以解决海量数据运维管理
可以在海量数据里高效查询
可以解决高并发下性能瓶颈
提高系统的可伸缩性和可扩展性
单实例性能到达瓶颈
单库容量超过2T
单表数据超过800W
年增量千万级
运营商登录服务: ? ? ? ?手机号表按照省份分表(31个表),即便这样对于广东省仍然有9千万的数据量,然后再水平分片(18个分片),按照单表不超800w的原则进行划分。 ? ? ?整体分库+分表如下图:
?
分布式事务、?广播sql 跨分片的join查询、?主键生成问题 、?扩容问题、? 热点库表问题 、?数据严重倾斜 、?聚合、复杂性查询、报表等问题 、?多IDC数据同步问题等等