vlambda博客
学习文章列表

神仙打架:PG和MySQL到底选啥?

本文介绍 MySQL 和 PostgreSQL 的一些特性对比,让大家了解二者的优劣,更好的做出选择。


图片来自 Pexels


当前国内的现状,互联网公司使用 MySQL 的较多,PostgreSQL 的使用比例反而不高,但相信看到 PG 的新特性后,你会爱上她。当然 MySQL 作为最流行的数据库,依然会吸引大部分人的眼球。


PostgreSQL 标榜自己是世界上很先进的开源数据库,甚至 PG 粉丝或者一些 PGER 宣称,她可以和 Oracle 相媲美(虽然 PG 很强大,但是和 Oracle 还是有差距的,当然 PG 优势也是显而易见的),而且没有那么昂贵的价格和傲慢的客服。


当然 PG 功能完善和强大是最早始于 9 版本,在 10 版本快速发展,增加很多功能和特性。


PostgreSQL 是完全由社区驱动的开源项目,他的核心代码,都是由社区维护,商用版本都是基于 PG 做的二次开发。


MySQL 声称自己是最流行的开源数据。看现在国内的现状,称得上名副其实。MySQL 被卖几次后,最终落到 Oracle 公司的囊中。


正是因此,MySQL 之父 Monty,修改了 MySQL 的源代码,创立了 MariaDB 分支。


说到这里当然不得不提另一个重要的分支,Percana 公司的 Percona Server。


Percona 公司更擅长 MySQL 运维,开发了很多非常实用运维工具,而且都已经开源,并回馈给社区,像 XtraBackup 和 pt-Toolkits 工具。


简单对比 MySQL 和 PostgreSQL 发现,MySQL 背后是成熟的商业公司(Oracle 有自己的 MySQL 企业版,收费,有许多社区版没有的特性),而 PostgreSQL 背后是一个庞大的志愿开发组。


相比而言,PostgreSQL 的商业性质更少一些,他没有所谓的 PostgreSQL 企业版,但是存在基于 PG 开发的一些企业级的 PG 数据库。


下面我将从以下几个方面阐述 MySQL 和 PostgreSQL 的异同和优劣,由于笔者水平的限制,不当之处,还请大家多提意见。


1

开源方面


PostgreSQL:The world’s most advanced open source database。


开源协议:PostgreSQL 基于自由的 BSD/MIT 许可,组织可以使用、复制、修改和重新分发代码,只需要提供一个版权声明即可。


PG 的开源协议特别灵活,任何公司的和个人都可以把 PG 作为一个产品销售,而不需要像 MySQL 那样必须修改大部分代码才可以作为公司的产品。


MySQL:World’s Most Popular Open Source Database。


开源协议:核心代码基于 GPL 或 Commercial License。


MySQL 的开源协议是基于 GPL 协议,任何公司都可以免费使用,不允许修改后和衍生的代码做为闭源的商业软件发布和销售,MySQL 的版权在甲骨文手中,甲骨文可以推了其商业闭源版本。

神仙打架:PG和MySQL到底选啥?

如上图所示,开源软件协议


2

ACID 支持方面


PostgreSQL 支持事务的强一致性,事务保证性好,完全支持 ACID 特性。


MySQL 只有 innodb 引擎支持事务,事务一致性保证上可根据实际需求调整,为了最大限度的保护数据,MySQL 可配置双一模式,对 ACID 的支持上比 PG 稍弱弱。


3

SQL 标准的支持方面


PostgreSQL 几乎支持所有的 SQL 标准,支持类型相当丰富。


MySQL 只支持部分 SQL 标准,相比于 PG 支持类型稍弱。


4

复制


MySQL 的复制是基于 binlog 的逻辑异步复制,无法实现同步复制。


复制模式:

  • 一主一备

  • 一主多备

  • 级联复制

  • 循环复制

  • 主主复制


数据流转优势: 通过 Canal 增量数据的订阅和消费,可以同步数据到 Kafka,通过 Kafka 做数据流转。


MySQL 所有的高可用方案都是基于 binlog 做的同步,以及基于 MySQL 的分布式数据也是基于 MySQL 的 binlog 实现,binlog 是 MySQL 生态圈最基本技术实现。


PostgreSQL 可以做到同步,异步,半同步复制,以及基于日志逻辑复制,可以实现表级别的订阅和发布。


复制模式:
  • 一主一备

  • 一主多备

  • 级联复制

  • 热备库/流复制

  • 逻辑复制


数据流转优势: 通过逻辑复制实现消息的订阅和消费,可以同步数据到 Kafka,通过 Kafka 实现数据流转。

5

并发控制


PostgreSQL 通过其 MVCC 实现有效地解决了并发问题,从而实现了非常高的并发性。


PG 新老数据一起存放的基于 XID 的 MVCC 机制,新老数据一起存放,需要定时触发 VACUUM,会带来多余的 IO 和数据库对象加锁开销,引起数据库整体的并发能力下降。而且 VACUUM 清理不及时,还可能会引发数据膨胀。


当然 PostgreSQL 还有一点影响比较,为了保证事务的强一致性,未决事务会影响所有表 VACUUM 清理,导致表膨胀。


MySQL 仅在 InnoDB 中支持 MVCC。 I nnoDB 的基于回滚段实现的 MVCC 机制,但是 MySQL 的间隙锁影响较大,锁定数据较多。


6

性能


PostgreSQL


①PostgreSQL 广泛用于读写速度高和数据一致性高的大型系统。此外,它还支持各种性能优化,当然这些优化仅在商业解决方案中可用,例如地理空间数据支持,没有读锁定的并发性等等。


②PostgreSQL 性能最适用于需要执行复杂查询的系统。

③PostgreSQL 在 OLTP/OLAP 系统中表现良好,读写速度以及大数据分析方面表现良好,基于 PG 的 GP 数据库,在数据仓库领域表现良好。

④PostgreSQL 也适用于商业智能应用程序,但更适合需要快速读/写速度的数据仓库和数据分析应用程序。

MySQL


①MySQL 是广泛选择的基于 Web 的项目,需要数据库只是为了简单的数据事务。但是,当遇到重负载或尝试完成复杂查询时,MySQL 通常会表现不佳。

②MySQL 的读取速度,在 OLTP 系统中表现良好。


③MySQL+InnoDB 为 OLTP 场景提供了非常好的读/写速度。总体而言,MySQL 在高并发场景下表现良好。

④MySQL 是可靠的,并且与商业智能应用程序配合良好,因为商业智能应用程序通常读取很多。

7

高可用技术的实现


PostgreSQL


①基于流复制的异步、同步主从。

②基于流复制的 Keepalive。

③基于流复制的 Repmgr。


④基于流复制的 patroni+etcd。


⑤共享存储 HA(corosync+pacemaker)。

⑥Postgres-XC。

⑦Postgres-XL。

⑧中间件实现:pgpool、pgcluster、slony、plploxy。


MySQL


①主从复制。

②主主复。

③MHA。

④LVS+KEEPALIVE。


⑤MGR 分布式数据库,多点写入[不建议],基于 Paxos 协议。

⑥PXC 分布式数据库,多点写入[不建议],基于令牌环协议。


⑦INNODB CLUSTER[8.0 新技术,基于 MGR 实现,上层封装命令],基于 Paxos 协议。

⑧中间件实现:Mycat。

8

外部数据源


PostgreSQL FDW:[foreign-data wrapper 的一个简称,可以叫外部封装。

PostgreSQL 不支持多数据引擎。 但支持 Extension 组件扩充,以及通过名为 FDW 的技术将 Oracle、Hadoop、MongoDB、SQLServer、Excel、CSV 文件等作为外部表进行读写操作,因此,可以为大数据与关系型数据库提供良好对接。


MySQL:无。

9

数据存储和数据类型


PG 主表采用堆表存放,存放的数据量较大,数据访问方式类似于 Oracle 的堆表。


MySQL 采用索引组织表,MySQL 必须有主键索引,所有的数据访问都是通过主键实现,二级索引访问时,需要扫描两遍索引(主键和二级索引)。

10

PostgreSQL 与 MySQL 优劣对比


PostgreSQL 相对于 MySQL 的优势


①在 SQL 的标准实现上要比 MySQL 完善,而且功能实现比较严谨。 

②存储过程的功能支持要比 MySQL 好,具备本地缓存执行计划的能力。

③对表连接支持较完整,优化器的功能较完整,支持的索引类型很多,复杂查询能力较强。

④PG 主表采用堆表存放,MySQL 采用索引组织表,能够支持比 MySQL 更大的数据量。 


⑤PG 的主备复制属于物理复制,相对于 MySQL 基于 binlog 的逻辑复制,数据的一致性更加可靠,复制性能更高,对主机性能的影响也更小。


⑥MySQL 的存储引擎插件化机制,存在锁机制复杂影响并发的问题,而 PG 不存在。 

⑦PG 对可以实现外部数据源查询,数据源的支持类型丰富。 

⑧PG 原生的逻辑复制可以实现表级别的订阅发布,可以实现数据通过 Kafka 流转,而不需要其他的组件。 

⑨PG 支持三种表连接方式,嵌套循环,哈希连接,排序合并,而 MySQL 只支持嵌套循环。 

⑩PostgreSQL 源代码写的很清晰,易读性比 MySQL 强太多了。 

⑪PostgreSQL 通过 PostGIS 扩展支持地理空间数据。地理空间数据有专用的类型和功能,可直接在数据库级别使用,使开发人员更容易进行分析和编码。 


⑫可扩展型系统,有丰富可扩展组件,作为 Contribute 发布。 

⑬PostgreSQL 支持 JSON 和其他 NoSQL 功能,如本机 XML 支持和使用 HSTORE 的键值对。


它还支持索引 JSON 数据以加快访问速度,特别是 10 版本 JSONB 更是强大。 

⑭PostgreSQL 完全免费,而且是 BSD 协议,如果你把 PostgreSQL 改一改,然后再拿去卖钱,也没有人管你。

这一点很重要,这表明了 PostgreSQL 数据库不会被其它公司控制。相反,MySQL 现在主要是被 Oracle 公司控制。


MySQL 相对于 PG 的优势


①InnoDB 的基于回滚段实现的 MVCC 机制,相对 PG 新老数据一起存放的基于 XID 的 MVCC 机制,是占优的。


新老数据一起存放,需要定时触发 VACUUM,会带来多余的 IO 和数据库对象加锁开销,引起数据库整体的并发能力下降。而且 VACUUM 清理不及时,还可能会引发数据膨胀。

②MySQL 采用索引组织表,这种存储方式非常适合基于主键匹配的查询、删改操作,但是对表结构设计存在约束。

③MySQL 的优化器较简单,系统表、运算符、数据类型的实现都很精简,非常适合简单的查询操作。

④MySQL 相对于 PG 在国内的流行度更高,PG 在国内显得就有些落寞了。

⑤MySQL 的存储引擎插件化机制,使得它的应用场景更加广泛,比如除了 InnoDB 适合事务处理场景外,Myisam 适合静态数据的查询场景。

11

总结


总体上来说,开源数据库都不是很完善,商业数据库 Oracle 在架构和功能方面都还是完善很多的。


从应用场景来说,PG 更加适合严格的企业应用场景(比如金融、电信、ERP、CRM),但不仅仅限制于此,PostgreSQL 的 json,jsonb,hstore 等数据格式,特别适用于一些大数据格式的分析。


而 MySQL 更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如 Google、Facebook、Alibaba),当然现在 MySQL 的在 InnoDB 引擎的大力发展,功能表现良好。

MySQL 和 PostgreSQL 复杂的开源关系型数据库,本文只是作者根据自己经验写的对 PG 和 MySQL 的理解,难免有不当之处,不当之处还请大家多多指正。


MySQL 在国内的发展已然很成熟,但是如果你转向 PostgreSQL,会发现不一样的天地,学院派的风格,丰富的功能,肯定会给你带来不一样的惊喜。

大咖来了



【时间】7 月 15,晚 8:00 

【讲师】李洋·雪松控股集团首席信息官

【直播】“金融安全 3.0”:新金融时代安全风险剖析与防范

【福利】答题赠书—《决胜金融安全 3.0 时代:新金融+新科技+新安全》

编辑:陶家龙

精彩文章推荐: