vlambda博客
学习文章列表

中信银行“天启”平台完成信通院全链路压测平台现场评估

4月11日,中信银行“天启”全链路压测平台完成中国信通院《全链路压测平台技术能力》现场评估流程,成为金融业首家完成该项能力的全链路压测平台。


随着云计算承载的业务系统规模爆发增长,系统承载的业务流量体量与日俱增,性能瓶颈成为整个系统稳定性的威胁之一。在此背景下,如何才能准确地测试系统的流量承载量,提前发现业务链路中的性能瓶颈,从而规避流量过载导致的系统崩溃成为亟待解决的问题。


可信云是中国信通院下属的云计算服务评估品牌,是我国针对云计算服务的权威评估体系。可信云面向全链路压测服务提供方,开展《全链路压测平台技术能力》评估,推出全链路压测平台技术能力的标准模型,旨在规范平台技术能力,推出全链路压测优质平台,扩大全链路压测在企业中的影响力和接受度,保障高并发场景下的系统稳定性。

4月11日,中信银行“天启”全链路压测平台完成中国信通院《全链路压测平台技术能力》现场评估流程,成为金融业首家完成该项能力的全链路压测平台。

中信银行“天启”平台完成信通院全链路压测平台现场评估

“天启”全链路压测平台


“天启”全链路压测平台是基于中信银行首创“性能合伙人”模式打造的一体化性能测试服务平台,以“助力中信银行信息系统质效双升”为目标,结合“三层门诊”工作机制,依托19项自主研发创新专利,通过创建全流程线上化标准管理体系、建立高度数字化的质量模型、构建全方位系统矩阵及路径导航之性能地图等,进而实现性能测试全生命周期一体化管控。大幅提高测试效率的同时,有效引导赋能开发人员开展自助式性能测试,扩大系统性能测试覆盖率。同时平台通过智能化资产管理,使系统性能资源、测试数据、历史问题等多维度数据形成透视,精准提升系统数字化风险分析和预警能力,从而使“天启”平台有机结合业务、开发、测试人员,实现资产共享。

中信银行“天启”平台完成信通院全链路压测平台现场评估

图1 天启首页


   “天启”平台作为中信银行性能全局质量流水线的管控者,运用数据挖掘、人工智能等先进技术手段进行创新,从测试标准、测试流程、测试策略、测试设计、风险预警等多方面进行攻坚克难,形成了测试流程一体化、性能体系标准化、测试经验工具化、质量数据全景化的平台体系。目前已广泛应用于中信银行信息系统建设流程当中,实现助推研发效能可量化、可分析、可提升。

中信银行“天启”平台完成信通院全链路压测平台现场评估

图2 天启整体架构


在天启平台建设过程中,中信银行性能测试团队结合信通院发布的《全链路压测平台技术能力》评估要求,从压测实施、压测准备、基础架构能力等方面进行补全,特别是开展全链路压测平台中智能识别性能瓶颈,实现定位热点栈及内存占用类和对象、应用代码级分析、链路调用耗时逐层下钻分析,如到SQL级耗时等;同时加强流程管控、安全审计相关能力等等,使得平台能够满足不同压测阶段、压测场景、压测环境的能力要求,更好地为中信银行的信息系统保驾护航。目前已对行内500+系统建立了系统画像,快速洞察和弥补系统短板;赋能全行200+系统实现自助压测,提前识别和消除系统瓶颈;性能地图收录300+全链路链条,可快速进行流量分析并显示瓶颈点和风险段落,同时结合系统健康检查结果确定扩容、分流、数据库优化等多种应急操作建议。与2020年相比,2021年在全年人员0增长的情况下,人均产能提升25%, 性能覆盖度提升至75%,生产事件降幅30%。通过建立集方法、标准、管理模式有机结合的全生命周期一体化管控体系,全面助力中信银行信息系统内建质量、质效双升。

图3 性能地图


“天启”平台通过独创自助式性能健康检查机制,对系统进行多维度度量,形成多维度系统性能画像,并关联可分析的生产事件样本,快速洞察和弥补系统短板;创建高竞争引入模型,从不同维度针对测试任务进行评分并引入掠夺时间窗口值概念,实现压力机智能调度;以执行结果TPS为依据,设置预定义规则,结合传统求解极值算法,实现智能探寻最优TPS ;依托高性能挡板协助平台实现对被测系统的精准容量评估;通过引入机器学习,对各节点数据流量及性能参数进行识别和记录,结合控制模型算法自动判断下游节点容量是否低于上游节点店容量,并将不间断的流控触发热点进行统计,形成路网数据图中的“红灯”,从而实现AI智能管控,实现容量流控“自由”。

图4 系统健康检查


经过一系列的探索实践,中信银行的性能质量生态建设初见成效,性能测试团队通过与架构、开发广泛协作,以天启平台作为底层支柱,将性能测试质量保障体系赋能整个软件开发中心,实现流程、方法和资产数据的全面共享,共筑坚实的质量“防火墙”。