本文主要介绍脸书为什么选择Hadoop和HBase。很详细,有一定的参考价值。感兴趣的朋友一定要看!
强大的水平可扩展性。对于像脸书这样的海量数据存储场景,扩展几乎是家常便饭,而HBase可以让数据扩展变得非常容易。
支持高写入吞吐量。脸书的新闻数据庞大,每天的写作量也很大。
在同一个数据中心,可以保证很强的一致性。为了用HBase存储消息数据,脸书需要一个能够保证业务一致性的数据存储(这也是脸书没有采用Cassandra[' wefondcassandra '新闻消息结构差异模式存储的七用途一致性模型'来自Quora]的原因之一)。
随机阅读性能好。消息系统的业务逻辑导致许多随机读取操作穿透缓存层。
高可用性、故障可恢复性。由于数据量大,可能会有很多分布式机器,故障或者做一些日常的升级工作会更加频繁,这就需要一个高可用性的系统。
错误隔离。一个节点的错误不会影响其他节点,磁盘故障只会影响对应的小规模数据。
提供原子读-修改-写操作。原子增量或者比较后的修改操作对于很多业务流程来说都非常方便。
提供获取一定范围数据的功能。例如,像获取某人的最后100条消息这样的功能是消息系统中非常常见的需求。
当然,Hadoop和HBase不擅长的以下几个方面也值得一提:
同一数据中心网络碎片下的容灾。同一数据中心的网络存在问题,导致节点之间无法正常通信。这种情况通常可以通过配置一些备用网络设备来避免。
数据中心故障不会影响服务。这种情况更加罕见。
多个数据中心之间的实时数据交换。这不现实。通常,缓存层用于实现用户对无端数据的实时访问。
以上就是《脸书为什么选择Hadoop和HBase》一文的全部内容。感谢您的阅读!希望分享的内容对大家有所帮助。更多相关知识,请关注行业资讯频道!
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/138383.html