vlambda
2020-01-01

从横切到纵切，架构模式CQRS，提高系统进化能力

曾几何时，你是否疑惑于VO、PO、DTO、BO、POJO、Entity、MODEL的区别？

你是否有过疑问，为什么Java里有这么多的以O为名称结尾的对象？！

你是否也厌倦了编写从这个O对象到那个O对象之间的转换代码？！

你有没有想过，这一切的根源在哪里呢？有没有办法解决这个问题呢？

本文试图给你答案！

分层架构的「原罪」

在架构风格：万金油CS与分层一文中提到，分层架构是个万金油架构，当你无法确定该使用哪种架构风格的时候，那么可以先使用分层架构。而实际上确实是这样，大部分的应用都采用了分层架构，特别是web应用。

以最简单的三层架构来说：

展示层：展示数据给用户
逻辑层：处理业务逻辑
持久层：持久化数据

每一层都负责各自的任务、职责单一，开发也就相对简单。每一层相对独立，所以都能够独立进化，这是分层架构所宣称的优势！也是其「原罪」！

分层架构虽然将系统按层进行划分，但是层与层之间还是需要进行交互的。交互就需要有接口或协议以及传输的数据。

对于外部调用，我们可以使用TCP、HTTP、RPC、WebService等方式来进行通信；而对于内部交互来说，我们可以直接使用方法调用，使用接口来进行解耦。

但是传输的数据结构该如何定呢？

第一种方式是直接使用基础数据结构，比如Map？这有几个问题：
没有代码提示，包括IDE层面的提示以及业务层面的字段提示，手误的几率较大。将编译期的错误延后到了运行期，降低了开发效率
没有较完备的基础设施，例如基于注解的字段校验
性能相对对象会差一点
第二种方式是使用一个对象进行传递，例如ActiveRecord或者直接使用Model。但是这会使各层强耦合，使得分层架构的优势消失。由于每层的进化速度不同：持久层相对比较稳定；逻辑层可能需要根据业务逻辑的不同而进行调整，例如打折策略；而展示层可能需要过一段时间调整，避免审美疲劳。其中一层对传输对象的调整都可能导致其它层跟着一起修改。
第三种方式就是上面说的使用各种传输对象：各层之间的数据传输使用独立的传输对象，使得各层松耦合。但是增加了各种传输对象以及转换代码。同时转换也消耗了部分性能。

各层的独立进化，导致了交互的额外操作！这就是分层架构的「原罪」！也是需要这么多传输对象的其中一个原因！

而另外一个原因是表现力差异！

再谈表现力

在领域设计：聚合与聚合根聊到了表现力问题，「数据设计」的表现力要弱于「对象设计」！相对应的，其实「数据展现」的表现力也是弱于「对象设计」的！

我们还是以订单来举例！假设我下单购买了多个商品，也就是说一个订单包含了多个明细。那么订单与订单明细的这层关系在「持久层」是通过主键来表现的：

从横切到纵切，架构模式CQRS，提高系统进化能力

订单明细包含了订单的主键，表示哪些订单明细是属于哪个订单的。

而这层关系在「逻辑层」是通过对象引用来表现的：

从横切到纵切，架构模式CQRS，提高系统进化能力

订单对象中持有了指向订单明细列表的引用。

而到了「展示层」，订单和订单详情之间的关系就完全靠展示方式来表现了：

从横切到纵切，架构模式CQRS，提高系统进化能力

如果你不了解业务，光看代码，是看不出订单与订单明细之间的关系的。上面只是纯粹的展示了订单明细在订单信息的下面。

也就是说，当我们访问页面的时候，请求从「持久层」将扁平的数据查询到了「逻辑层」，组装成了结构化的对象，最后被传递到了「展现层」，又被拍扁了展示在我们面前。

由于每层表现形式的不同，亦导致了需要数据传输对象。

从横切到纵切

既然横向封层不可避免的需要数据传输对象来解耦各层之间的关系，那我们是否不使用横向封层，而使用纵向切分呢？这就是CQRS架构模式！

CQRS通过对系统进行纵向切分：将「数据读」和「数据写」分离开，使得数据读写独立进化，来解决数据显示复杂性问题。

CQRS架构如下：

从横切到纵切，架构模式CQRS，提高系统进化能力

流程如下：

客户端构建命令对象CommandModel发送给服务端
服务端通过命令总线CommandBus接收到命令，委托给对应的CommandHandler去处理
CommandHandler处理完业务，将此命令通过Repository进行持久化（不一定是DB，下面会具体说）
同时会构建一个对应的事件Event，添加到事件总线EventBus中（该事件可以是同步事件、也可以是异步事件）
对应的EventHandler会对该事件进行处理，比如处理成便于展示的模型，存储到ReadDB中
客户端可以对服务端发送查询，服务端直接从ReadDB中获取数据，构建QueryModel返回

这又什么优势呢？

首先，现在只需要CommandModel和QueryModel两个数据传输对象，不再需要那么多的中间传输对象了。也就是说，省略了这部分的代码和性能损耗。
其次，读写分离，可以对读写进行专门的优化。
最后，就是可以事件溯源EventSourcing。这个我们来详细说一下。

我们以订单保存和展示流程来详细的看一下CQRS的优势！

对于普通分层架构来说，在保存订单时需要一个DTO用于存储相关信息，然后转成多个对应的Model来进行持久化；而查询订单的时候，你需要查询出多个Model，然后组装成另一个DTO来存储查询的信息，因为展示的时候可能要展示更多的信息，比如买家和卖家相关信息。

同时由于数据都存储在数据库中，且表结构与Model是对应的，你能做的优化就是数据库相关的优化手段。

而在CQRS中，数据库被分成了读库和写库。那存在读库中的数据结构就可以完全按照展示逻辑来优化，比如：我可以有一张订单展示表，表中包含了买家信息和卖家信息。在展示时，直接查询这张表就可以了，不需要和用户表进行关联查询，提高了数据读性能。

而对于数据持久化来说，就不需要考虑数据展示了，只要提高持久化性能就可以了。例如不使用数据库，而使用顺序写入的文件方式。同时也不一定要存储数据本身，转而存储事件，就可以实现事件重演，这就是事件溯源。

事件溯源

在领域设计：Entity与VO一文中，提到了「状态」！

一般我们处理状态都是直接去修改它，像下面这样：

从横切到纵切，架构模式CQRS，提高系统进化能力

那么请问，这个开关刚才经历了什么？！这是典型的ABA问题，即你只知道这个开关目前的状态，但是它曾经有没有开过或关过，你就无从得知了。

我们对数据的处理也是这样，你只知道当前存在数据库中的数据是什么，而它曾经被修改过没有？被修改成过什么，你无从知晓。

因为我们存的只是「即时状态」，即「快照」！

事件溯源存储的不是数据「快照」，而是「事件本身」！即它记录了所有对该数据的事件。

如果你了解Redis的持久化方案，你对事件溯源就一定不会感到陌生。Redis有两种持久化方式RDB方式和AOF方式：

RDB：在指定的时间间隔内，执行指定次数的写操作，则会将内存中的数据写入到磁盘中。对当前数据快照进行持久化
AOF：将指令追加到文件末尾。通过指令重演来恢复数据

我们一般的持久化方式实际对应的就是Redis的RDB方式，而事件溯源就是AOF方式。

回到上图，在CQRS中，WriteDB可以通过类AOF的方式来存储命令，也就是事件溯源。当需要对ReadDB中的数据进行恢复操作时，可以通过命令重演的方式来恢复。

不过你应该发现问题了，命令重演的方式性能上有问题。所以我们可以参考Redis，使用快照+事件溯源的方式来存储。即WriteDB中存储事件，额外再定时对数据进行快照备份。恢复数据时先通过快照备份恢复，再从指定位置进行命令重演，来提高性能。

强一致性or最终一致性

读写分离后，导致的一个问题就是读写一致性。在原来的分层架构中，数据写入后再读取，是可以立即读取到写入的数据的（事务保障）。

但是读写分离后，读到的数据不一定是写入的最新数据。一般情况下，这个问题并不大。因为实际上你读的基本上都是历史数据！为什么这么说呢？因为你没法保证数据在展现到你面前的过程中，没有新的写入。除非展示是基于推送机制的。

但是对于特殊情况下，可能不能容忍这样的情况。有几种解决方案：

临时性的显示先前提交给命令模型的参数
在页面展示查询模型的时间
使用类似Comet这样的长链接的方式或者事件模式来监听数据

参考资料
CQRS：https://martinfowler.com/bliki/CQRS.html
《实现领域驱动设计》

扫码关注

vlambda博客
学习文章列表

从横切到纵切，架构模式CQRS，提高系统进化能力

分层架构的「原罪」

再谈表现力

从横切到纵切

事件溯源

强一致性or最终一致性

标签:

推荐阅读

相关文章

vlambda博客 学习文章列表

从横切到纵切，架构模式CQRS，提高系统进化能力

分层架构的「原罪」

再谈表现力

从横切到纵切

事件溯源

强一致性or最终一致性

标签:

推荐阅读

相关文章

vlambda博客
学习文章列表