文档参考
优点
- 运行快
- 架构简单 —-> 利于维护
-
缺点
昂贵
- 单点故障,所有服务终止
- 摩尔定律 :硬件和软件需求,增长不是线性的(集群扩容难度)
分布式
一个硬件或软件组件分布在不同的网络计算机上,彼此仅仅依靠网络消息进行通信和协调的系统
特点
- 分布性:很多台服务器可以在空间中任意分布(分布未来可以动态变换、扩容)
- 对等性:集群中很多节点的角色是一样的
- 并发性:很多节点同时操作一个数据库
- 无全局时钟
-
相比集中式
分布式性价比更高
- 处理能力更强(内存、CPU、磁盘空间)
-
存在的问题
通信问题:网络不可用、网络有延迟、数据传输可能会丢失
-
分布式性能衡量指标
吞吐性:在一定的时间内可以处理的数据量
- 并发量最大处理数据量
- 系统响应延时
- 可用性:系统出现异常时,能够正确提供服务了能力
- 可扩展性:集群扩展好后,是否易于扩展
- 扩展要考虑HDFS的负载均衡,计算程序 / 数据怎么分布到新的节点
- 一致性:副本机制引发的一致性问题(副本操作的时间差/时间延迟)
分布式事务协议:2PC
用来解决分布式事务的原子性问题,将提交事务分为准备阶段和提交阶段