vlambda博客
学习文章列表

【特大喜讯】Apache Cassandra 4.0正式发布

期待已久的4.0版本,终于在2021.7.27正式GA发布,社区blog原文:

https://cassandra.apache.org/_/blog/Apache-Cassandra-4.0-is-Here.html


Cassandra 4.0版本显著提升了性能和可靠性,降低了使用成本,也极大的优化了用户体验。关于4.0版本发布的部分特性(主要DataStax公司整):

  • 变更数据捕获(Change Data Capture)

变更数据捕获(CDC)允许数据库轻松的集成到更广阔的数据生态系统。Cassandra 4.0通过在commit log日志写入的同时索引日志,从而创建了实时的CDC。这样既提高了性能,又从核心日志实现中抽象出来,极大的便利了CDC工具和用户。

  • 对恶意客户端限流,减少“嘈杂邻居(Noisy Neighbor)”问题

一直以来,行为不端的客户端其实是数据库面临的严峻问题。Cassandra以往都是平等对待所有的客户端请求,且都默认为是善意和均衡的。Cassandra 4.0则引入了客户端的限制作为反压(Backpressure)功能的一部分。每一个IP用来执行命令的内存都得到了管理和限制。所以当一个客户端的内存到达上限,Cassandra 4.0会用反压机制减速执行命令或者使集群向该客户端报错。

  • 审计日志

将审计日志添加到Cassandra,使高度合规的工作负载部署成为可能。Netflix贡献了审计日志相关代码。Cassandra 4.0的审计日志策略高度可配置,如文件大小,位置,格式,乃至命令类型等。可满足公司的合规性需求,以及SOX,PCI和GDPR等的规定。

  • 支持Java 11

Java 11早在2018年便已面世,在垃圾回收等方面有显著改进,但之前Cassandra一直没有应用这些优异特性。在Java 17发布之前,Cassandra 4.0会长期支持Java 11。

  • 吞吐量提升25%-70%

相比3.11版本,4.0版本提高了25%-70%的吞吐量,从而处理相同工作负载的硬件数量得以减少。在压实操作时降低高达50%的内存分配和Java 11带来的新垃圾回收算法是两大主要的驱动因素。

  • 对尾部延迟有高达7倍的改善

尾部延迟指的是处理小分比请求的延迟,与创建“快速数据”的用户体验息息相关。数据证明,尾部延迟是影响企业用户收入的重要因素。相比3.11版本,4.0版本可以达到原来1/7的尾部延迟。

  • 增量修复:实现可靠的快速修复

修复是指Cassandra检查集群中所有数据,来消除集群中的数据不一致性。增量修复可以显著缩短硬盘和CPU用来修复的时间。Cassandra 4.0解决了增量修复中一些故障模式,使操作人员进一步降低了对硬盘和CPU的要求。

  • 虚拟表(Virtual Table)

扩展了的虚拟表包含了数据模式,配置和指标,创建了一种与Cassandra交互与管理的一站式解决方案,使得对Java管理扩展(JMX)的访问需求不再是必须的。有了对虚拟表和CQL的访问权限,用户能够更轻易观察集群,查找数据模式以及执行查询,达到更轻松管理集群的目的。

  • 完整查询日志(Full Query Logging)

工作负载捕捉是排查产品问题,复杂迁移和测试新系统的重要工具。Cassandra 4.0加入了完整查询日志(FQL),确保了整个产品的工作负载可以被捕捉以及被流畅的重放。


关于DataSta公司的产品:

●      DataStax Astra 是旨在简化云原生应用程序开发的 Cassandra 托管服务。非常适合想要开发现代应用程序但不想运维自己的数据库的组织。开发人员可以免费使用。

●      DataStax Enterprise 是适用于需要从 RDBMS 实现数据现代化或将其无序生长的各种 NoSQL 数据库统一到一个平台的企业。非常适合喜欢负责自己的数据库运维的组织。