所谓的性能测试调优都是在调什么?
性能测试技能树
下面细化一下性能测试所要掌握的知识,如图1-1所示。
▲图 1-1 技能树
1.1
测试工具
LoadRunner 与 JMeter, 当然了,工具也不能解决所有问题,有时候还是需要自己编写程序来实现测试脚本。很多初学者认为这2个工具只能用来做性能测试,其实能做性能测试的工具也可
以做功能自动化测试。不是非得 Selinum、WebDriver等才能做自动化测试。
常见难点
(1) 用户和业务模型分析搭建;
(2) 合适的脚本开发(大部分初学者不根据用户和业务模型来开发脚本,认为要回归成功即可);
(3) 合适的需求分析转化为场景设计(大部分初学者不知道如何根据需求进行场景设计):
(4)大容量系统的数据生成和使用;
(5) 大型系统的性能压力负载和实施;
(6) 云计算的负载生成和实施。
1.2
测试基础
性能测试是一门富有挑战的、有深度的、综合性的学科。
很多性能测试初学者总觉得性能测试就是写个脚本,弄几台机器测一测,出个报告就行了。通常关注“并发多少”“响应时间多少”“能跑通吗”这些问题。认为并发越大,响应时间越快,那性能一定就越好。
性能测试不仅仅是录制脚本或者编写程序,基本的性能理论、性能执行的原则还是要了解的。同样的脚本,不同的人员执行,不同的针对点,测试结果会大相径庭。
实际上我们需要对系统进行一系列复杂的需求分析,以及一系列性能测试计划和设计的工作才能开始性能测试执行。经过N次回归,找到瓶颈的具体原因,并优化。掌握性能理论基础才能驾驭那些性能测试工具等,没有掌握性能理论基础直接操作好比开车找不到目标,盲目原地打转或离目标越来越远。
自动化测试的目的是为了提高工作效率,目前,功能测试与性能测试都朝着这个方向发展,这些都是持续集成的一部分。
鉴于目前行业内普遍项目时间紧,性能测试架构师在公司担任性能测试、自动化测试等多种角色,那么减少加班和追求高效益和高成就是我们全栈性能测试工作者的追求了。
有时候测试工具并不能够解决测试脚本问题,比如现在流行的 SOA 架构封装的RPC协议,就需要写代码来解决脚本问题。业内比较有名的比如 Dubbo、Dubbox, 笔者也碰到过这一类的测试,鉴于工作的重复性,为了节省时间提高效率,ROAD_TESTING
团队在为某企业团队性能测试内训时对 JMeter 进行二次开发(如图1-2所示), 专门用来测试 Dubbo、Dubbox 协议的接口,这样功能测试人员就可以直接选择测试的项目与接口进行测试,不需要编程实现测试脚本,大大提高了脚本开发效率。
▲图1-2 Dubbo 测试组件
常见难点
(1) 评估需求;
(2) 负载建模(用户与业务模型);
(3) 性能压力生成的原理和并发等之间的关系;
(4) 性能测试用例;
(5) 新系统需求分析;
(6) 容量规划;
(7) 性能测试策略。
1.3
代码
作为IT部门的一员不可避免地要和开发代码打交道,了解编程知识既能提高测试内涵, 还能提高交流沟通的效果。更重要的是,做自动化测试、单元测试、性能测试、安全测试都离不开代码。所以我们还是要掌握一些普及率高的编程语言和脚本语言。这里我们推荐Java、Python等。
Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,目前也是国内公司使用的相对普及的语言。
Python具有丰富和强大的库。它常被称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++) 很轻松地连结在一起。Python 是目前国内测试行业比较热门的一门语言,很容易上手,也可以搜索公共库的代码来缩减自己写代码的工作量和时间。
1.4
服务器性能诊断知识
不管我们的程序如何高大上,不管我们用什么语言实现,最终还是要依赖服务器硬件,依赖数字信号,依赖模拟电路。服务器硬件是性能之本,所有性能都会反映到硬件指标上来,我们想要分析性能,服务器知识少不得。服务器几大件,如CPU、存储、内存、网络的性能指标,监控方法都需要熟练掌握。管理这些硬件的操作系统的原理,性能配置参数也需要掌握。要掌握这部分需要学习很多运维和开发知识。
了解操作系统及其内核对于系统分析是至关重要的。作为性能测试工程师来说我们需要进行对系统行为做分析:系统调用是如何执行的、CPU是如何调度线程、有限大小的内存是如何影响性能的,或者是文件系统是如何处理I/O的,这些都是我们判断系统瓶颈的依据和线索。
1. Linux
Linux是一套免费使用和自由传播的类UNIX 操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 UNIX工具软件、应用程序和网络协议。它支持32位和64位硬件。Linux继承了 UNIX 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。越多越多的企业用这个系统作为服务器的操作系统,所以作为性能测试从业者来说,是必须掌握的系统之一,搭建环境、性能诊断是离不开它的。
目前 Linux/UNIX 的分支很多,普及率比较多的有 CENTOS、Ubuntu、RedHAT, Red Hat HP-UX、AIX、Solaris等。
2. Windows Server
Windows Server是 Microsoft Windows Server System (WSS) 的核心,是服务器操作系统。目前使用比较多的都是中小型公司,目前2008和2012版本相对比较多。
数据库是我们系统存储处理的最重要的手段,很大一部分性能问题都牵扯到数据库。所以我们需要深入地了解掌握数据库的语言SQL, 以及常规的性能诊断和调优手法。
数据库目前有很多,关系型的如 DB2、Oracle、SQLServer、MySQL等,更有非关系型临时性键值存储(memcached、Redis) 、永久性键值存储(ROMA、Redis) 、面向文档的数据库(MongoDB、CouchDB) 、面向列的数据库(Cassandra、HBase) Hadoop等。
3. Oracle
Oracle Database, 简称 Oracle.是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oraclc 数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的适应高吞吐量的数据库解决方案。
4. MySQL
MySQL是Oracle 收购的一个轻量型开源数据库,越来越多的公司为应对日益增长的数据库规模,在原有的基础上二次开发分布式数据库,也是目前国内比较流行的数据库。很多大型公司也在 MySQL的基础上进行了分布式的开发,MySQL的能力被大大增强。
5. NoSQL数据库
NoSQL, 泛指非关系型的数据库。随着互联网 Web 2. 0 网站的兴起,应对超大规模和高并发的网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发展。NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。NoSQL 有很多种类型,我们来一起了解。
(1) 键值数据库-Redis
支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,它提供多种语言的 API。其特点是每次存储一个数据时,是根据 Key 进行索引存储的。Redis 适用于数据变化快且数据库大小可预见的应用程序,股票、数据分析、实时数据搜集、通信等。7月阿里云宣布推出了自己的 Redis 云数据库KVStore for Redis, 应用于游戏、电商、社交等行业。
(2) 列存储数据库-Cassandra
最初由 Facebook 开发,于2008年转成开源项目。它是混合型的非关系数据库,在网络社交云计算方面应用较理想,读操作比写操作快很多,较适用于银行、金融、数据分析等领域。
(3) 文档型数据库-MongoDB、CouchDB
文档型数据库的灵感来自于Lotus Notes 办公软件,而且它同第一种键值存储类似。该类型的数据模型是版本化的文档,半结构化的文档以特定的格式存储,如 JSON.文档型数据库可以看作是键值数据库的升级版,允许之间嵌套键值。而且文档型数据库比键值数据库的查询效率更高。
图形结构的数据库同其他行列以及刚性结构的SQL数据库不同,它是使用灵活的图形模型,并且能够扩展到多个服务器上。许多 NoSQL 数据库都有 REST 式的数据接口或者查询API, 如 Neo4J、InfoGrid、Infinite Graph。
常见难点
(1) 进程、线程任务之间的区别?
(2) 线程的中断优先和原理?
(3) 进程的生命周期?
(4) 上下文切换?
(5) I/O密集型和CPU 密集型工作负载之间有什么区别?
(6) 生产环境和测试环境之间换算?
(7) 关系型数据库体系结构和逻辑优化与非关系型数据库体系结构和逻辑优化?
(8) 事务数据库和分析数据库的使用?
(9) 数据关系建模与设计?
(10) TOPNSQL 诊断和优化(执行路径、索引和表链接优化等)?
(11) 阻击和根治阻塞和死锁?
(12) 热点防范和定位优化?
(13) 业务数据批量缓存化\异步化?
(14) 数据库配置优化?
1.5
性能调优技能
面对一个性能不佳复杂的系统,我们做的是建立性能数据分析模型、收集相关资源和指标信息、分析这些数据背后可能的原因。很多人说性能测试最难的就是定位性能瓶颈,笔者赞同这种看法。这需要扎实的全栈IT技术基础和业务敏感度以及解决经验。
另外性能优化是一个系统工程,内容涉及系统各方面,从上到下有软件产品(项目)、中间件、虚拟机、操作系统、硬件。软件产品有系统架构、业务设计、代码实现、数据库物理设计及数据库各种配置等。所以想要做好性能调优,不仅仅是一个人的事,而是整个项目团队的事。
对于测试来说,不管是脚本实现,还是测试过程中的网络监测,都需要针对通信协议;常见的 HTTP/HTTPS、Socket/WebSocket, WebService (Soap) 等协议运用广泛,自然要熟悉。具体请看后面性能优化章节。
常见难点
(1) 系统硬件资源(CPU、网络、内存、IO) 相互之间的关系及原理;
(2) 选择可靠性能指标及指标之间的关联和判定方法;
(3) 永不宕机的实现原理和常见错误;
(4) 排队系统与延迟及缓存的优化关系;
(5) 优化的成本和性价比;
(6) 业务优化的操作实施;
(7) 多系统串联原理及测试隔离。
性能测试初体验
性能测试是一项综合性的工作,致力于暴露性能问题,评估系统性能趋势。性能测试工作实质上是利用工具去模拟大量用户操作来验证系统能够承受的负载情况,找出潜在的性能问题,分析并解决;找出系统性能变化趋势,为后续的扩展提供参考。测试显然不是录制脚本那么简单的事情(而且现在很多系统还无法录制脚本)。本章带您进入性能的领域,阐述性能测试涉及的IT知识、角色、视角、流程及面临的挑战。
建议性能测试初学者仔细阅读本文、把握性能测试的大致格局和重点。
往期精彩文章