vlambda博客
学习文章列表

AIOPS智能运维,超高地体现运营价值的能力

AIOps(Artificial Intelligence for IT Operations):智能运维


前言

AIOps也就是Artificial Intelligence for IT Operations,智能化运维;这是一种运营趋势,可以很大的提高运营的能力,实现更高的价值;朝着把平凡的项目实现智能运维的目标出发吧

业务运维发展趋势

  1. 提升IT基础架构运营能力

    基于大数据分析的思路,在IT领域运用大数据技术,更加科学高效的对基础架构进行监控,问题发现,告警与处置。

  2. 优化用户体验及业务运营能力

    基于大数据技术,对用户体验进行全面分析,不断优化用户端到端的用户体验及业务运营能力。

  3. 实现智能化运营能力

    通过大数据和人工智能最新技术,实现更加智慧与高效的企业运营,为社会与企业创造更多的价值。

阶段性能力要求

  1. 大数据运维

    1. 部署大数据核心平台

    2. IT,网络,私有云等数据接入

    3. IT基础设施监控及大屏

    4. 网络监控及大屏

    5. 私有云平台可视化大屏

    6. 统一告警平台

    7. 落地大数据运维基础分析

  2. 业务运维

    1. 采集用户端以及后端性能数据

    2. 应用拓扑实时大屏

    3. 真实用户体验监控及大屏

    4. 浏览器用户体验及大屏

    5. 端到端应用性能深入分析

    6. 企业业务管理驾驶舱

    7. 业务到应用到IT系统关联分析

  3. 智能运维

    1. 部署机器学习平台

    2. 部署深度学习平台

    3. IT资源规划预测

    4. 用户体验与用户留存预测

    5. 应用健康对业务影响预测

实现目标

  1. 跨系统

    能够将多系统的数据进行统一的汇总,在相应模型的梳理下,将原本孤立的数据孤岛进行连接。

  2. 高效率

    不再割裂的看到故障现象,能够快速的在多个表象中,理清因果关系,并将根因快速的挖掘出来。

  3. 高精准

    最大程度的避免人为判断时引入的干扰因素,使得分析结果的可行度大大提升。也随着故障处理次数的积累,可以给出相应的处理意见。

  4. 面向业务

    从最终也是最重要的业务角度入手,自影响业务的结果入手,不断拓展需要考虑的影响因素。在此基础上,才能真正发现业务与运维数据之间的关联性。

个例目标

  1. 更加主动

    1. 实时感知真实用户性能体验

    2. 借助机器学习能够进行故障预测

    3. 更加丰富多样的告警通知方式

  2. 关联性分析

    1. 更高效的找到问题根因

    2. 通过时序或逻辑,找到多个现象互相影响的关系

    3. 将告警进行关联后, 减少人为筛选无用或重复信息的成本

  3. 更加紧密连接业务

    1. 从业务视角切入,更直接的支持业务提升

    2. 通过大数据技术,打通多个业务之间的数据孤岛

    3. 更好体现IT部门在公司中的价值

  4. 高效呈现

    1. 大屏、报表、报告、 API多种呈现方式,灵活多样

    2. 大数据技术,使得实时数据呈现成为可能

    3. 在同面积视野中,呈 现更多维度的信息

总结

看完大家是不是对AIOPS了解更深刻了呢,即使是微不足道的项目,我们也可以从大数据运维出发,不断沉淀数据,做好业务的运维,再向智能运维出发,实现高价值的运维能力。

请大家多多关注