vlambda博客
学习文章列表

宜人贷:ZooKeeper推动信息流动,迎接未来机遇和挑战

数据一致性是什么?它是评估数据质量的一个关键点,通常我们说的一致性是指用来描述同一信息主体在不同的数据集中信息属性是否相同,各实体、属性是否符合一致性约束关系。

数据存储的一致性模型认为是存储系统和数据使用者之间的一种约定,如果使用者遵循这种约定,则可以得到系统原本设定的访问结果。常用的数据一致性模型包括:严格一致性、顺序一致性、因果一致性、管道一致性、弱一致性、释放一致性、最终一致性、增量一致性等。

在分布式系统里的多台服务器要对数据状态达成一致,其实是一件兼具难度和挑战的事情,因为服务器集群环境的软硬件故障可能会出其不意到来,打乱使用者既定的步骤和计划。多台服务器对一个数据的记录保持一致,需要一些技巧和设计。

当主服务器宕机时就切换到从服务器上访问,但如果不同的应用程序或者DataNode做出的关于主服务器是否可用的判断不同,那么就会导致HDFS集群混乱。所以,这时候需要一个专门进行判断的服务器当裁判,且决策的服务器必须由多台服务器组成,来保证高可用性,即任意一台服务器宕机都不会影响系统的可用性。用户经常使用Zookeeper作为多台服务器状态一致性的解决方案。

ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是Google的Chubby一个开源的实现,是Hadoop和Hbase的重要组件。它是一个为分布式应用提供一致性服务的软件,可以提供配置维护、域名服务、分布式同步、组服务等多种功能。

信息流动是自由的、无限制的。宜人贷认为,互联网是全球性产物,ZooKeeper对信息流动产生了不可忽视的作用,它让未来处处充满机遇和挑战。