vlambda博客
学习文章列表

从产品的本质,谈谈生产环境的全链路压测

最近一直在线上认识新的技术同行的朋友(网友)


在行业内知名的左耳朵耗子老师

在重点高校负责高校信息中心的W博士

在高校授课,同时搞了家容器云的C博士

北大研究生毕业,曾经在一家在线支付公司做容器云,现在自己在搞容器云公司的L兄

互联网支付巨头之一的负责性能和质量的Z兄

在虚拟货币交易所负责研发的高级总监 R兄

最近美国Goverment封杀的菊花厂,负责某大BG运维的Z总

证券行业的D总

机票旅游网的W兄

做CICD startup的Q总

北京一家新金融科技的C总


这些网友,心态都非常open,愿意分享他们的行业经验,聊新技术、新产品。在交流的过程中,顺便交流交流我们公司的生产环境的全链路压测产品。


其实在这个过程中,能够给到我一个很大的帮助,以上这些网友们,都是各行各业的非常资深的专家。换句话来说通过交流,能够帮助我们更加深入了解各行各业的场景,看我们的产品是否能够解决客户真正的痛点,给客户带来价值。


下面,我想围绕 “产品” 这个词,来写写我对 生产环境的全链路压测 这个产品的认知。


在我们学习过的技术知识里面,有一类东西叫做原理。比如数据库的事务,有ACID四个特性,原子性、一致性、隔离性、持久性。TCP/IP协议里面,建立连接三次握手,这些都叫知识点,这些是非常本质的东西。


那产品的本质、定义是什么?


产品的定义:向市场提供的,引起注意、获取、使用或者消费,以满足欲望或需要的任何东西。——百度百科词条“产品”  (极度抽象的一段话)


产品就是要同时解决用户的问题和公司的问题的东西。——苏杰《人人都是产品经理》


我认为生产环境全链路压测产品,解决的主要问题是:  一个企业或者组织,有一个非常重要的系统,这个系统的访问用户,峰值读写访问量,每秒超过1000 QPS(这个是我随便拍的),这个系统面临两个大的问题, 1. 系统是否能平稳支撑用户的访问  2.这个系统到底需要多少的容量。


当然,产品不能只说要解决的问题,还有很多方面需要展开。


《启示录--打造用户喜欢的产品》一书里面,提到要评估一个产品的机会,需要回答几个核心的问题,我根据这里面的问题,对我们的产品进行一个总结和思考 


问题 回答

产品要解决什么问题 

(产品价值)

在大流量的情况下,要确保系统的稳定性和容量的合理评估。传统的线下性能性能,无法复制一个和生产环境一模一样的集群环境来进行压测,导致压测结果不真实,最终影响稳定性和容量评估。


最直接的收益,可以直接在生产环境进行安全压测,节省了搭建一套和生产一模一样环境的机器。 

比如线上有1000台VM和8台DB,则节省了在线下环境搭建这1000台VM和8台DB的钱。

为什么我们最适合

做这个产品

(竞争优势)

1.团队优势:我们核心成员来自于阿里,深度参与了阿里2013年第一次在生产环境的全链路压测。CEO震南是资深的业务架构师,CTO平威是原阿里hsf、rocketmq等核心中间件的源码开发者,我原来在阿里主要是做核心数据库的性能和稳定性保障。


2产品优势:已在多个客户合作上线,包括日订单量1.5亿的客户上上线


3.更适合绝大多数客户的场景:  生产压测,有企业通过改造业务系统、中间件来识别压测流量,也有企业把压测流量直接写入到真实表里面。 


我们提供的方案是,客户不需要做业务系统的改造,通过配置,可以把压测流量隔离到影子表里面,做到安全的生产压测。




参考资料

苏杰 《人人都是产品经理》

Marty Cagan 《启示录:打造用户喜爱的产品》