深度探索之AIOps现在与未来
由ITShare智享会、BMC联合出品的“金融业AIOps运维大脑建设与实践”线上云直播专场活动圆满成功。新网银行副行长李秀生、上海期货交易所国际能源中心CTO、上期信息技术公司董事长郑仕辉、中国光大银行信息科技部副总经理彭晓 、国泰君安数据中心副总经理毛梦非、光大证劵信息技术总部副总经理杨超、民生银行信息科技部总经理助理兼数据中心副总经理彭真山、阳光财产保险信息技术部总经理李瑞、BMC大中华区首席架构师赵成栋等多位嘉宾现身直播间,与线上近百位行业资深专家、企业数字化转型的见证者和实践者等,一起分享探讨金融业AIOps建设与实践的难点痛点。
随着国内金融行业IT系统数据集中、业务集中,IT系统规模逐渐增大,关联关系日益复杂,所支持的系统运行的硬件数量也越来越多,对IT系统的安全性,可用性与持续依赖程度也越来越高,均使得日常维护等管理工作变得比过去更加严峻和复杂,内部需求的驱动也使得这一切变得更迫切,金融行业即将迎来智能运维时代,我们应该如何看待AIOps建设与实践?
民生银行信息科技部总经理助理兼数据中心副总经理彭真山先生受邀参加了此次线上直播活动,他向大家分享了多年金融业AIOps建设观点与实践经验。
AIOps建设需要什么?
拓展空间在哪里
疫情对大家的生活、工作方式等等方面有很多的冲击和改变。而且这种冲击和改变还会持续很长的时间,这可能是一些不可逆的改变。所以我们也在思考AIOps,到底未来应该怎么去看待这个事情,怎么去投入?
AIOps建设需要什么,第一个投入是必须的。大家讨论的AIOps现在到底能对传统运维带来多大的提升价值和空间,都在观望的。但无论如何这是一个趋势,为什么说它是一个趋势?一方面,社会发展已经到了智能化的阶段,我们说智能风控,智能客服,还是智能营销,那运维为什么不能智能?这可能是社会发展的需求。
另外一个方面,也是别人对我们的要求,比如开发微服务架构的改造,分布式的改造,现在都不是一个系统,几百台机器这种运维。还有就是对我们运维人员自身的要求。运维的人,未来定位价值是什么?建设需要什么?就是在这种可能局势还不是特别明朗,但历史的大趋势已经来了的情况下,我们在AIOps,有没有一些坚定的投入,这个是要考量的。
如果做AIOps的话,着眼点可能不能仅仅是运维,通过做AIOps,反过来去看运维的架构,包括运维输出的开发、系统输出,运维所需要的数据是否完备,怎么去规范开发规范性的提升,这可能也是能够更好地去建设AIOps的一个基石,如果前面开发产生的数据的规范性不是特别好的话,可能智能运维也做不出什么特别好的价值来。
现在建设需要什么?可能更需要大家一起,包括跟各位专家一起探讨,到底智能运维的适用场景有哪些场景?如果仅仅局限在运维本身、技术层面,可能空间没有那么大。AIOps也不一定仅仅是我们科技运维的概念,是不是可以把它拓展一些,拓展到一些业务运营更多的方面?这里面能不能用一些智能的算法,反过来去跟业务能够做一个更好的融合?或许这也是AIOps一个未来的方向。
其实我们这些年做的,主要在根因分析,异常检测,多维特征分析,容量预知和资质分析这块,感觉是一个点一个点地做。但是就跟自动驾驶一样,能够车道保持,可以自适应去巡航,也可以自动泊车,但还达不到这种自动驾驶,达不到所谓的大佬的这种感觉。单点应用会比较多,总体的协同还是稍微差一些,有局限性,一个是数据的局限。包括两方面,一方面是数据覆盖度的问题,现在数据产生的海量数据,流量分析,包括安全,大家都有各方面的流量分析工具,攻击的工具,这些数据怎么和现在海量数据数据一起联动?另一方面覆盖度的问题,第一是有没有都收集起来,第二是收集起来以后,怎么联动,是数据的覆盖性的问题。
另外还有一个,现在的数据,一般情况下正常的数据非常多,在金融行业大家对异常的场景还是比较敏感的,所以相对来说异常的场景产生的数据量是很少的,异常场景本身就很少,这也是对机器学习提出了一些数据方面不一样的要求。
除了数据局限以外,还有一个算法的局限。现在一些公司为什么会在某些点上做得不错,可能就是在某个点都需要很高深的算法支持,而且各个场景之间的算法,通用性、转换性可能不是很强。所以从金融行业来说,更多的是去应用,要更多的去依赖于底下一些厂商的基础能力的建设,他们把路修好了,我们才能够在上面跑得更快。
AIOps这个事,任重道远,可能在未来,它的水平是衡量一个数据中心整体发展水平的指标,而且需要算法能力的支持和场景的适用,所以将来对数据中心全员的转型,或者是数字化的转型,可能是一个必要条件。AIOps是运维人员的明天,希望大家能够通过一个很好的点,去激发所有运维人员的未来。