Solution - 《Notes》 - 极客文档

1 需求分析

2 结构设计
2.1 KV结构存储, key 为userid, value为byte array.
2.2 Client API
put(table, userId, list)
get(table, userId, list)

3 方案设计

读写性能要求高, 并发量大, 存储量大. 一致性要求低, 关联和结构化查询要求低. 因此选择非结构化方案. BigTable like: HBase Cassandra.
HBase vs Cassandra.
- 负载均衡主从 vs 一致性hash.
- 一致性方案 Strong consistency vs read repair.
- 可用性多HBase实例 vs NWR多副本.

HBase读写性能更好, 成本更低. 可用性相对较差, 但可以接受.
3.1 查询.

3.2 更新.

3.3 持久化.
数据(HFile)持久化到Hadoop. Hadoop可以满足和离线数据导入导出, 以及离线数据多副本要求.
3.4 可用性
内存级别可靠性, 配置跨机房多HBase实例.

Solution - 图1