搜文章
推荐 原创 视频 Java开发 iOS开发 前端开发 JavaScript开发 Android开发 PHP开发 数据库 开发工具 Python开发 Kotlin开发 Ruby开发 .NET开发 服务器运维 开放平台 架构师 大数据 云计算 人工智能 开发语言 其它开发
Lambda在线 > 中云科技公司 > 中云科技分布式存储系统——互联网发展新趋势

中云科技分布式存储系统——互联网发展新趋势

中云科技公司 2020-07-01





点击上方“蓝字”,发现更多精彩。

引言:分布式的处理方式越来越受到业界的青睐----计算机系统正在经历一场前所未有的从集中式到分布式架构的变革。


随着计算机系统规模变得越来越大,将所有业务单元集中部署在一个或者若干个大型机上的体系结构物,已经越来越不能满足当今计算机系统,尤其是大型互联网系统的快速发展,各种灵活多变的系统架构模型层出不穷。

同时,随着微型计算机的出现,越来越多廉价的PC机成为了各大IT企业架构的首选,分布式的处理方式越来越受到业界的青睐----计算机系统正在经历一场前所未有的从集中式到分布式架构的变革。


 从集中式到分布式 

自从20世纪60年代大型主机被发明出来以后,凭借其超强的计算和I/O处理能力 以及在稳定性和安全性方面的卓越表现,在很长一段时间内,大型主机引领了计算机行业以及商业计算领域的发展。在大型主机的研发上最知名的当属IBM,其主 导研发的革命性产品System/360系列大型主机,是计算机发展史上的一个里程碑,与波音707和福特T型车齐名,被誉为20世纪最重要的三大商业成就,IT界进入了大型主机时代。

伴随着大型主机时代的到来,集中式的计算机系统架构也成为了主流。在那个时候,由于大型主机卓越的性能和良好的稳定性,其在单机处理能力方面的优势非常明显,使得IT系统快速进入了集中式处理阶段,其对应的计算机系统称为集中式系统。但从20世纪80年代以来,计算机系统向网络化和微型化的发展日趋明显,传统的集中式处理模型越来越不能适应人们的需求,具体表现在:

1、大型主机的人才培养成本非常高,通常一台大型主机汇集了大量精密的计算机组件,操作非常复杂,这对一个运维人员掌握其技术细节提出了非常高的要求。

2、大型主机也是非常昂贵的,通常一台配置较好的IBM大型主机,其售价达到上百万美元甚至更高,因此也只有像政府、金融和电信等企业才有能力采购大型主机。

3、集中式有非常明显的单点问题,大型主机虽然在性能和稳定性方面表现卓越,但并 不代表其永远不会出故障。一旦一台大型主机出现了故障,那么整个系统将处于不可用的状态,后果相当严重。最后,随着业务的不断发展,用户访问量迅速提高, 计算机系统的规模也在不断扩大,在单一大型主机上进行扩容往往比较困难。

4、随着PC机性能的不断提升和网络技术的快速普及,大型主机的市场份额变得越来越小,很多企业开始放弃原来的大型主机,而改用小型机和普通PC服务器来搭建分布式计算机。

中云科技分布式存储系统——互联网发展新趋势

对业内新闻比较关注的,一定知道阿里巴巴在2009年发起了一项"去IOE"运动。因为阿里巴巴从2008年开始各项业务都进入了井喷式的发展阶段,这对于后台IT系统的计算与存储能力提出了非常高的要求,一味地针对小型机和高端存储进行不断扩容,无疑会产生巨大的成本。

同时,集中式的系统架构体系也存在着诸多单点问题,完全无法满足互联网应用爆炸式的发展需求。因此,为了解决业务快速 发展给IT系统带来的巨大挑战,从2009年开始,阿里集团启动了"去IOE"计划,其电商系统开始正式迈入了分布式系统时代。


 什么是集中式存储 

所谓集中式系统就是指由一台或多台主计算机组成中心节点,数据集中存储于这个中心 节点中,并且整个系统的所有业务单元都集中部署在这个中心节点上,系统所有的功能均由其集中处理。也就是说,集中式系统中,每个终端或客户端及其仅仅负责 数据的录入和输出,而数据的存储与控制处理完全交由主机来完成。

集中式系统最大的特点就是部署结构简单,由于集中式系统往往基于底层性能卓越的大型主机,因此无需考虑如何对服务进行多个节点的部署,也就不用考虑多个节点之间的分布式协作问题。

中云科技分布式存储系统——互联网发展新趋势


 什么是分布式存储 

分布式系统如何定义?这里引用一下Distributed Systems Concepts and Design(Third Edition)中的一句话:"A distributed system is one in which components located at networked computers communicate and coordinate their actions only by passing messages"。从这句话里面我们可以看到几个重点:

  • 1、组件分布在网络计算机上
  • 2、组件之间仅仅通过消息传递来通信并协调行动

严格讲,同一个分布式系统中的计算机在空间部署上是可以随意分布的,这些计算机可能被放在不同的机柜上,也可能在不同的机房中,甚至分布在不同的城市。无论如何,一个标准的分布式系统在没有任何特定业务逻辑约束的情况下,都会有以下几个特征:

1、分布性

分布式系统中的多台计算机都会在空间上随意分布,同时,它们的分布情况也会随时变动。

2、对等性

分布式系统中的计算机没有主/从之分,既没有控制整个系统的主机,也没有被控制的 从机,组成分布式系统的所有节点都是对等的。副本(Replica)是分布式系统最常见的概念之一,指的是分布式系统对数据和服务提供的一种冗余方式。在 常见的分布式系统中,为了对外提高可用的服务,我们往往会对数据和服务进行副本处理。数据副本是指在不同的节点上持久化同一份数据,当某一个节点上存储的 数据丢失时,可以从副本上读取到该数据,这是解决分布式系统数据丢失问题最为有效的手段。另一类副本是服务副本,指多个节点提供同样的服务,每个节点都有 能力接收来自外部的请求并进行相应的处理。

3、并发性

在一个计算机网络中,程序运行过程中的并发性操作是非常常见的行为,例如同一个分布式系统的多个节点,可能会并发地操作一些共享的资源,诸如数据库或分布式存储等,如何准确并高效地协调分布式并发操作也成为了分布式系统架构与设计中最大的挑战之一。

4、缺乏全局时钟

一个典型的分布式系统是由一系列空间上随意分布的多个进程组成的,具有明显的分布性,这些进程之间通过交换消息来进行相互通信。因此,在分布式系统中,很难定义两个事件究竟谁先谁后,原因就是因为分布式系统缺乏一个全局的始终控制序列。

5、故障总是会发生

组成分布式系统的所有计算机,都有可能发生任何形式的故障。一个被大量工程实践过 的黄金定理是:任何在设计阶段考虑到的异常情况,一定会在系统实际运行中发生,并且,在系统实际运行中还会遇到很多在设计时未考虑到的异常故障。所以,除 非需求指标允许,在系统设计时不能放过任何异常情况。

6、处理单点故障

在整个分布式系统中,如果某个角色或者功能只有某台单机在支撑,那么这个节点称为单点,其发生的故障称为单点故障,也就是通常说的SPoF(Single Point of Failure),避免单点而对关键就是把这个功能从单机实现变为集群实现,当然,这种变化一般会比较困难,否则就不会有单点问题了。如果不能把单点变为集群实现,那么一般还有两种选择:

(1)给这个单点做好备份,能够在出现问题时进行恢复,并且尽量做到自动恢复;
(2)降低单点故障的影响范围。
中云科技分布式存储系统——互联网发展新趋势


  分布式系统的意义  

从单机单用户到单机多用户,再到现在的网络时代,应用系统发生了很多的变化。而分布式系统依然是目前很热门的讨论话题,那么,分布式系统给我们带来了什么,或者说是为什么要有分布式系统呢?从三方面考虑:

1、升级单机处理能力的性价比越来越低

摩尔定律:当价格 不变时,每隔18个月,集成电路上可容纳的晶体管数目会增加一倍,性能也将提升一倍。这个定律告诉我们,随着时间的推移,单位成本的支出所能购买的计算机 能力在提升。不过,如果我们把时间固定下来 ,也就是固定在某个具体时间点来购买单颗不同型号的处理器,那么所购买的处理器性能越高,所要付出的成本就越高,性价比就越低。那么,也就是说在一个确定的时间点,通过更换硬件做垂直扩展的方式来提升性能会越来越不划算。

2、单机处理能力存在瓶颈

某个固定时间点,单颗处理器有自己的性能瓶颈,也就说即使愿意花更多的钱去买计算能力也买不到了。

3、出于稳定性和可用性的考虑

如果采用单机系统,那么在这台机器正常的时候一切OK,一旦出问题,那么系统就完全不能用了。当然,可以考虑做容灾备份等方案,而这些方案就会让系统演变为分布式系统了。


  去中心化存储是兵家必争之地  



在区块链的应用中,除了“数字货币”、“智能合约”,还有一个非常热门的的领域一直以来也都是各路英雄的竞技场,那就是去中心化存储。

在去中心化存储领域有老牌项目Filecoin+IPFS、SiaCoin、Storj,还有近来新入场的项目LAMB、Yotta等,并且新项目还在源源不断地涌现。

为什么如此多的项目都竞相在这个领域厮杀?

在回答这个问题之前,我们先看看“数字货币”和“智能合约”。


中云科技分布式存储系统——互联网发展新趋势

 “数字货币”应用的匮乏 


说起“数字货币”,我们都知道最有名的案例便是BTC、莱特币以及BTC的分叉BCH。这三个币目前的市值和业内外共识都非常高。然而绝大部分这三个币的持有者都只是把它们当作价值存储和投资的工具,而很少把它们用在实际生活中。

虽说有一大堆国内外的网上商城或实体店(不乏国际知名企业比如微软)支持消费者用这三个币进行支付和消费,但相对于法币,无论是在交易量和交易频度上,它们都还相差太远,谈不上广泛使用,也并没有给商家本身带来多少额外的商业利益。

中云科技分布式存储系统——互联网发展新趋势

  “智能合约”应用的止步不前  


说起“智能合约”,我们第一个会想到的就是以太坊。它是智能合约的鼻祖,是目前在区块链世界中应用得最广泛的智能合约平台,也是在整个数字货币领域仅次于BTC的币种。

在2016-2017的爱西欧狂潮中,以太坊向全球证明了智能合约的威力,让大家想象出一幅由智能合约高效、公平、公正地管理和运行的虚拟世界,这是人类从未有过的体验。正是在这样的远景下,一批专注于智能合约的项目如雨后春笋般暴发。

虽然随着爱西欧的没落,以太坊的价格也暴跌,但是人们对智能合约的期望仍然非常高,在这个领域的探索仍然在不断地前进。

然而由于种种原因,迄今为止人们发现智能合约能够高效发挥作用的领域仍然非常有限,虽然在很多领域人们也做过很多尝试,但是就现在的技术水平而言,还有太多技术方面的原因导致智能合约还无法大规模在实际生活和商业中应用。智能合约平台同样也无法给商家带来多少直接的商业利益。

在和以太坊概念诞生的同时期(2014年),另外一群探索者们发现可以把区块链的技术用于改造现有存储领域的商业模式。

中云科技分布式存储系统——互联网发展新趋势


  现有存储模式的弊病  


在现有的存储领域,绝大多数企业和个人用户都会选用各种各样的云存储。

我们经常用的有阿里云、腾讯云、百度云等。在通常状况下它们都能很好的工作,也没有人会想到要改变什么。然而近年来,由于某些服务的限制性以及公司数据泄漏的频繁报道,人们越来越担心存储在这些云上的数据安全和隐私泄露问题。

业内曾经发生过一起案例:国内某知名云服务商由于操作上的不慎,遗失了存储在其云上的某创业公司的数据,这一事件几乎导致该公司的倒闭,这个损失可谓相当惨重。

在我们的想象中,这些数据备份在这个云存储服务商的云上,他应该有备份才对啊,然而实际情况却是,这个服务商为了节省成本并没有作足够的备份,因此导致了数据一旦遗失无法恢复。

在中心化的存储中,我们只能相信和依赖中心化的机构,而无法核实他们是否真正提供了我们期望的服务。

中云科技分布式存储系统——互联网发展新趋势


  去中心化存储的商业魅力  


而利用区块链去中心化的存储可以做到由算法保证我们的数据有足够的备份,并且分散地存储在系统的若干个节点中。这样即便某个节点的数据发生损坏,我们还能在其它备份节点找到数据。

这个概念一提出,便引起业界热烈的反响。在业界看来去中心化存储是目前最接地气并且最有可能首先实现大规模商用的区块链技术。一旦一项技术实现大规模商用,一方面将极大改进现有商业模式的效率,另一方面也将直接带来可观的经济效益。

嗜血的资本和雄心勃勃的项目方便怀着极大的热忱前仆后继地投入这个领域。





作为分布式存储的领航者,中云科技目前正在快速布局,未来形成包括云存储、云计算、大数据的产业集群,可以更好的引领传统企业升级转型,推动整个新经济的发展。


为存储而来,为服务而生,中云科技正在悄然地改变着整个世界,改变你我的生活。



中云科技分布式存储系统——互联网发展新趋势

- 分布式应用场景一站式解决方案 -
One-Stop Solution
For  Distributed Application Scenarios




戳原文,加入中云!

版权声明:本站内容全部来自于腾讯微信公众号,属第三方自助推荐收录。《中云科技分布式存储系统——互联网发展新趋势》的版权归原作者「中云科技公司」所有,文章言论观点不代表Lambda在线的观点, Lambda在线不承担任何法律责任。如需删除可联系QQ:516101458

文章来源: 阅读原文

相关阅读

关注中云科技公司微信公众号

中云科技公司微信公众号:gh_ccf6de73e0f9

中云科技公司

手机扫描上方二维码即可关注中云科技公司微信公众号

中云科技公司最新文章

精品公众号随机推荐