什么是分布式架构?智云星空带你解答
智云星空分布式系统(distributed system)是建立在网络之上的软件系统。
内聚性是指每一个数据库分布节点高度自治,有本地的数据库管理系统。
透明性是指每一个数据库分布节点对用户的应用来说都是透明的,看不出是本地还是远程。
智云星空在分布式数据库系统中,用户感觉不到数据是分布的,即用户不须知道关系是否分割、有无副本、数据存于哪个站点以及事务在哪个站点上执行等。
简单来讲:在一个分布式系统中,一组独立的计算机展现给用户的是一个统一的整体,就好像是一个系统似的。
智云星空分布式系统作为一个整体对用户提供服务,而整个系统的内部的协作用户来说是透明的,用户就像是在使用一个MySQL一样。
如分布式MySQL中间件-Mycat,来处理大并发大数据量的构架。
分布式架构的应用
智云星空分布式文件系统,分布式缓存系统,分布式数据库,分布式WebService,分布式计算
我们来举例说明:
智云星空分布式文件系统:出名的有 Hadoop 的HDFS ,还有 google的 GFS , 淘宝的 TFS 等
智云星空分布式缓存系统:memcache , hbase , mongdb 等
智云星空分布式数据库 :MySQL , Mariadb, PostgreSQL 等
以分布式MySQL数据库中间件MyCat 为例子,
MySQL 在现在电商以及互联网公司的应用非常多,一个是因为他的免费开源,另外一个原因是因为分布式系统
智云星空的水平可扩展性,随着移动互联网用户的暴增,互联网公司,像淘宝,天猫,唯品会等电商都采用分布式系统应对
用户的高并发量以及大数据量的存储。
而在Mycat的商业案例中,有对中国移动的账单结算项目中,应用实时处理高峰期每天2亿的数据量,
在对物联网的项目中,实现处理高达26亿的数据量,并提供实时查询的接口。
通过对MyCat的学习,加深分布式系统架构的理解,
智云星空以及分布式相关的技术,分布式一致性ZooKeeper服务, 高可用HAProxy/keepalived等相关应用。
1> 集群 与 分布式
2> 负载均衡
3> 分布式相关的高可用、容灾等名词解释
4> Mycat 中间件学习
智云星空首先推荐4本书
大型分布式网站架构设计与实践
http://item.jd.com/11529266.html
大型网站技术架构:核心原理与案例分析
http://item.jd.com/11322972.html
大型网站系统与Java中间件实践
http://item.jd.com/11449803.html
分布式Java应用:基础与实践
http://item.jd.com/10144196.html
貌似都是4位阿里人写的,一本一本的看吧,绝对会增强你的内功。
分布式架构的演进
初始阶段架构
智云星空初始阶段 的小型系统 应用程序、数据库、文件等所有的资源都在一台服务器上通俗称为LAMP
特征:
应用程序、数据库、文件等所有的资源都在一台服务器上。
应用服务和数据服务分离
好景不长,发现随着系统访问量的再度增加,webserver机器的压力在高峰期会上升到比较高,这个时候开始考虑增加一台webserver
特征:
应用程序、数据库、文件分别部署在独立的资源上。
使用缓存改善性能
特征:
数据库中访问较集中的一小部分数据存储在缓存服务器中,减少数据库的访问次数,降低数据库的访问压力。
描述:
系统访问特点遵循二八定律,即80%的业务访问集中在20%的数据上。
缓存分为本地缓存和远程分布式缓存,本地缓存访问速度更快但缓存数据量有限,同时存在与应用程序争用内存的情况。