vlambda博客
学习文章列表

稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

4月26日,由中国信息通信研究院(以下简称“中国信通院”)主办的“稳保计划”——首届云系统稳定性大会”在京召开。会上,中国信通院云大所副所长栗蔚深度解读了稳保计划,并公布了“全链路压测”首批评估成果。


随着云计算承载的业务系统规模增长、流量及体量与日俱增,性能瓶颈成为系统稳定性的威胁之一。在此背景下,如何才能准确地度量系统的流量承载能力,提前发现业务链路中的性能瓶颈,从而规避流量过载导致的系统崩溃成为亟待解决的问题。


可信云是中国信通院下属的云计算服务评估品牌,是我国针对云计算服务的权威评估体系。可信云面向全链路压测服务提供方,开展《全链路压测平台技术能力》评估,推出全链路压测平台技术能力的标准模型,旨在规范平台技术能力,推出全链路压测优质平台,扩大全链路压测在企业中的影响力和接受度,保障高并发场景下的系统稳定性。



中信银行“天启”全链路压测平台顺利通过中国信通院首批《全链路压测平台技术能力》“先进级”评估。

稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

“天启”全链路压测平台

“天启”全链路压测平台是基于中信银行首创“性能合伙人”模式打造的一体化性能测试服务平台,以“助力中信银行信息系统质效双升”为目标,结合“三层门诊”工作机制,依托19项自主研发创新专利,通过创建全流程线上化标准管理体系、建立高度数字化的质量模型、构建全方位系统矩阵及路径导航之性能地图等,进而实现性能测试全生命周期一体化管控。大幅提高测试效率的同时,有效引导赋能开发人员开展自助式性能测试,扩大系统性能测试覆盖率。同时平台通过智能化资产管理,使系统性能资源、测试数据、历史问题等多维度数据形成透视,精准提升系统数字化风险分析和预警能力,从而使“天启”平台有机结合业务、开发、测试人员,实现资产共享。


稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

图1 天启首页


“天启”平台作为中信银行性能全局质量流水线的管控者,运用数据挖掘、人工智能等先进技术手段进行创新,从测试标准、测试流程、测试策略、测试设计、风险预警等多方面进行攻坚克难,形成了测试流程一体化、性能体系标准化、测试经验工具化、质量数据全景化的平台体系。目前已广泛应用于中信银行信息系统建设流程当中,实现助推研发效能可量化、可分析、可提升。


稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

图2 天启整体架构


在天启平台建设过程中,中信银行性能测试团队结合信通院发布的《全链路压测平台能力分级要求》标准,从压测实施、压测准备、基础架构能力等方面进行补全,特别是开展全链路压测平台中智能识别性能瓶颈,实现定位热点栈及内存占用类和对象、应用代码级分析、链路调用耗时逐层下钻分析,如到SQL级耗时等;同时加强流程管控、安全审计相关能力等等,使得平台能够满足不同压测阶段、压测场景、压测环境的能力要求,更好地为中信银行的信息系统保驾护航。目前已对行内500+系统建立了系统画像,快速洞察和弥补系统短板;赋能全行200+系统实现自助压测,提前识别和消除系统瓶颈;性能地图收录300+全链路链条,可快速进行流量分析并显示瓶颈点和风险段落,同时结合系统健康检查结果确定扩容、分流、数据库优化等多种应急操作建议。与2020年相比,2021年在全年人员0增长的情况下,人均产能提升25%, 性能覆盖度提升至75%,生产事件降幅30%。通过建立集方法、标准、管理模式有机结合的全生命周期一体化管控体系,全面助力中信银行信息系统内建质量、质效双升。


稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

图3 性能地图


“天启”平台通过独创自助式性能健康检查机制,对系统进行多维度度量,形成多维度系统性能画像,并关联可分析的生产事件样本,快速洞察和弥补系统短板;创建高竞争引入模型,从不同维度针对测试任务进行评分并引入掠夺时间窗口值概念,实现压力机智能调度;以执行结果TPS为依据,设置预定义规则,结合传统求解极值算法,实现智能探寻最优TPS ;依托高性能挡板协助平台实现对被测系统的精准容量评估;通过引入机器学习,对各节点数据流量及性能参数进行识别和记录,结合控制模型算法自动判断下游节点容量是否低于上游节点店容量,并将不间断的流控触发热点进行统计,形成路网数据图中的“红灯”,从而实现AI智能管控,实现容量流控“自由”。


稳保计划 | 中信银行通过首批全链路压测“先进级”能力评估

图4 系统健康检查


经过一系列的探索实践,中信银行的性能质量生态建设初见成效,性能测试团队通过与架构、开发广泛协作,以天启平台作为底层支柱,将性能测试质量保障体系赋能整个软件开发中心,实现流程、方法和资产数据的全面共享,共筑坚实的质量“防火墙”。

关于“稳保计划”

“稳保计划”以保障企业系统稳定性、提升数字化业务连续性、促进业务高质量发展为目标,在前期、中期、后期等不同阶段设置了安全生产计划、稳定性体检工程、稳定性测试组、稳定性守护者成员、系统稳定性度量评估环节,通过混沌工程、全链路压测、全链路压测、应用多活等手段全方位推进企业系统稳定性能力建设。截至目前,已有来自证券、银行、保险、互联网、通信运营商、汽车、医疗、零售等不同行业的二十余家头部企业和机构参与了“稳保计划”,并基于云服务、技术平台、业务系统等完成了系统稳定性相关评估。


了解全链路压测相关工作,请联系

李老师 [email protected]

了解稳保计划相关工作,请联系

王老师 [email protected]