1 Myisam 索引和数据分开的设计考量
可缓存更多索引,有利于查询
2 业务报表系统的架构演进——从 mysql 到 elasticsearch
单表几百万行。后来改成 elasticsearch。
原因1:大数据系统,很多时候 hadoop 跑出来的结果还是很大,一天就几千万结果数据,几十亿明细数据,那mysql是抗不住这么大量的数据的。所以现在大数据一般用kylin做离线数据的分析引擎,直接hive数据导入kylin里面去了,或者也可以走elasticsearch。
原因2:sql 查询语句复杂,MySQL 负载比较高。
原因3:实时数据报表,就是storm或者是spark streaming,跑数据出来,来一条算一条,然后结果立马写入mysql中,这个的话,一般就保留当天数据,其实压力不会太大。但是问题在于说,可能写并发会超高,每秒并发轻易就可以几千甚至上万。所以大数据实时报表不会写mysql了,现在一般都是写es。
3 极客时间 《SQL必知必会》
