阿里、百度、滴滴在智能化监控平台建设上的探索

百家 作者:InfoQ 2021-02-26 14:07:28

随着智能运维快速发展,规模化落地并取得业务收益成为重要话题,各个行业也都在纷纷尝试落地 AIOps。目前,AIOps 的主要应用场景有异常告警、告警收敛、故障分析、趋势预测等。

5 月 29-31 日,QCon 全球软件开发大会(北京站)2021,设置“AIOps 最佳实践”专题,邀请了滴滴出行、阿里巴巴、百度和 58 集团等大厂的技术专家,他们将结合 AIOps 最新技术和落地实践,详细解读 AIOps 的应用场景、业务痛点、收益、如何落地等宝贵经验,并针对 AIOps 的发展趋势进行探讨和展望,帮助大家将智能运维规模化落地。

今日正值元宵佳节,现在购买门票,除了享受 7 折特惠福利之外,两人拼团再减 200 元!最后一天,惊喜福利不容错过哦!可咨询客户经理 ring:17310043226(同微信)

“AIOps 最佳实践”专题详细信息提前 Get:

1滴滴智能监控体系建设实践

分享嘉宾:艾毅 滴滴出行 高级专家工程师

监控系统是观测业务的窗口,对于业务稳定性而言至关重要。智能故障发现、故障定位、故障自愈等都依赖稳定、可靠、智能的监控系统。本次分享将围绕滴滴的业务场景,详细介绍滴滴智能监控体系建设实践。

你将收获:
  1. 了解滴滴如何系统化、体系化的构建智能高效的监控体系

  2. 了解滴滴的实时计算平台建设经验

  3. 了解大规模智能异常检测算法实践经验

2Sunfire- 阿里巴巴集团监控平台智能化监控探索和实践

分享嘉宾:王肇刚(梓弋) 阿里巴巴 高级技术专家

Sunfire 平台作为阿里巴巴集团监控平台,多年以来一直支持和保障着阿里巴巴集团海量技术规模下的业务指标、应用状态及系统资源监控能力,也作为阿里巴巴技术风险体系的前哨和基石,支持了阿里巴巴集团稳定性工作的不断演进。本次演讲会分享阿里巴巴集团监控平台在智能监控领域的规划和展望。同时,也会简单介绍面向混合云企业客户的监控产品解决方案。

你将收获:
  1. 学习和了解阿里巴巴集团技术风险业务体系、监控平台技术体系及技术架构演进

  2. 学习和了解阿里巴巴集团双 11 背后的秒级智能业务指标异常检测技术原理和架构演进

  3. 学习和了解阿里巴巴集团智能错误码异常检测技术原理

358 集团在稳定性建设领域的智能运维探索

分享嘉宾:龚诚 58 集团 智能运维团队负责人

58 集团在稳定性建设领域做了很多智能运维的探索,在监控的自动添加、多类型指标的异常检测、告警治理、故障根源原因分析、故障自愈等方面取得了一些进展。另外,在容量管理和成本优化、服务质量评估和技术风险发现等方面都有一些实践,有力的保障了服务稳定性。

你将收获:
  1. 学习和了解在稳定性建设领域的智能运维实践经验

  2. 学习和了解在智能监控业务中如何做到全流程闭环

  3. 学习和了解在容量管理和成本优化、服务质量评估和技术风险发现的实践经验

4百度故障管理场景的 AIOps 探索与实践

分享嘉宾:王博 百度 资深研发工程师

本次分享将介绍百度在故障管理的一些经验,以及在故障发现、故障止损、故障诊断和故障预测环节的一些智能运维算法探索,最后将分享百度在故障管理场景的一些实践案例。

你将收获:
  1. 了解百度的运维平台发展历史,对于智能运维算法的理解和实施要素

  2. 了解百度在故障管理场景遇到的难点问题、智能运维算法思想和落地案例

  3. 了解百度在故障预测环节的具体实践和未来工作思路

除此之外,企业实践 AIOps 需要哪些前提条件呢?完整的 AIOps 实践需要具备哪些能力?企业转型为 AIOps,运维人员的工作需要做哪些转变?当前,国内 AIOps 实践到底进行到哪个阶段了?…以上这些大家关心的问题,现场技术专家将为大家一一解答。

了解更多大会专题安排可扫描下图二维码或点击【阅读原文】立即查看。

点个在看少个 bug

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接