架构师临时总结 - 《田云的博客笔记》

设计原则
合适原则、简单原则、演化原则

读写分离：读大于写，读成为性能问题的时候。

什么时候分库分表？

1.做硬件优化，例如从机械硬盘改成使用固态硬盘，当然固态硬盘不适合服务器使用，只是举个例子
2.先做数据库服务器的调优操作，例如增加索引，oracle有很多的参数调整;
3.引入缓存技术，例如Redis，减少数据库压力
4.程序与数据库表优化，重构，例如根据业务逻辑对程序逻辑做优化，减少不必要的查询;
5.在这些操作都不能大幅度优化性能的情况下，不能满足将来的发展，再考虑分库分表，也要有预估性

数据库
当看到表的数据量达到千万级别时，作为架构师就要警觉起来，因为这很可能是架构的性能瓶颈或者隐患

水平分表
一般建议分段大小在 100 万至 2000 万之间

路由算法
范围路由：因为一般是根据ID，所以。
范围路由的一个比较隐含的缺点是分布不均匀，假如按照 1000 万来进行分表，有可能某个分段实际存储的数据量只有 1000 条，而另外一个分段实际存储的数据量有 900 万条。
Hash 路由：
Hash 路由的优点是表分布比较均匀，缺点是扩充新的表很麻烦，所有数据都要重分布。
配置路由
配置路由就是路由表，用一张独立的表来记录路由信息。同样以用户 ID 为例，我们新增一张 user_router 表，这个表包含 user_id 和 table_id 两列，根据 user_id 就可以查询对应的 table_id。

单台 Memcache 服务器简单的 key-value 查询能够达到 TPS 50000 以上

在一个分布式系统（指互相连接并共享数据的节点的集合）中，当涉及读写操作时，只能保证一致性（Consistence）、可用性（Availability）、分区容错性（Partition Tolerance）三者中的两个，另外一个必须被牺牲。
一致性（Consistency）：
对某个指定的客户端来说，读操作保证能够返回最新的写操作结果。
对于系统执行事务来说，在事务执行过程中，系统其实处于一个不一致的状态，不同的节点的数据并不完全一致
可用性
非故障的节点在合理的时间内返回合理的响应
分区容忍性（Partition Tolerance）必选
当出现网络分区后，系统能够继续“履行职责”