新浪微博

目前新浪微博是Redis全球最大的用户。在新浪有200多台物理机在运行着Redis,有大量数据跑在Redis上来为微博用户提供服务。
新浪通过修改Redis的源码满足自己的业务需求:完善它的复制机制,加入position的概念,让维护更容易,同时失败时容错的能力也大大增强

淘宝数据平台

数据产品的一个最大特点是数据的非实时更新,正因为如此,可以认为在一定时间段内,整个系统的数据只是可读的。
淘宝数据库产品有Oceanbase、Tair等

视觉中国网站

优酷运营数据分析

飞信空间

SNS类型应用中,Feed的数据量最大。Feed数据的存储与读写操作往往是技术难度最高的部分,由于Feed要求的高并发写入,弱一致性,使MySQL的HandlerSocket成为NoSQL技术的主要应用战场。
HandlerSocket是日本DeNA公司的架构师Yoshinori开发的一个NoSQL产品,以MySQL插件的形式运行。其主要的思路是在MySQL的体系架构中绕开SQL解析这一层,使得应用程序直接和Innodb存储引擎交互。通过合并写入和协议简单等手段提高了数据访问的性能,在CPU密集型的应用中这一优势尤其明显

豆瓣社区

BeansDB是一个有国内知名网站豆瓣网自主研发的主要针对大数据量和高可用性的分布式Key/Value存储系统,采用HashTree和简化的版本号来快速同步保证最终一致性。相当于一个简化版的Dynamo,它在伸缩性和高可用性方面有非常好的表现。它采用类似Memcached的去中心化结构,在客户端实现数据路由。它具有如下特性:

  • 高可用:通过多个可读写的用于备份实现高可用
  • 最终一致性:通过哈希树实现快速完整数据同步(短时间内数据可能不一致)
  • 容易拓展:可以在不中断服务的情况下进行容量拓展
  • 高性能:异步网络IO,日志结构的存储方式Bitcask
  • 简单协议:Memcached兼容协议,大量可用客户端