AIOps平台旨在减少警报疲劳
AIOps似乎对哭泣的狼感到高兴–白天和黑夜,铃声四起,通知IT站点可靠性工程师(SRE)可能有问题。或不。IT基础结构越大,越复杂,对误报和“警报噪声”的响应就浪费了更多的时间和精力,从而使IT团队无法解决需要修复的实际问题。
用于定制软件开发的基于云的“可观察性平台”的制造商New Relic今天宣布,去年收购事件智能厂商SignifAI取得了丰硕的成果,并发布了用于呼叫DevOps,SRE和网络运营的AIOps套件。中心IT团队。据该公司称,它被称为New Relic AI,它应用AI和机器学习来帮助检测和解决IT事件,并不断改善事件管理工作流程。
行业分析公司MarketsandMarkets报告称,到2023年,AIOps平台市场预计将增长到110.2亿美元,Gartner预测在三年内,将有40%的DevOps团队将利用AIOps功能。该技术解决了不断受到压力的IT团队的迫切需求,以满足服务水平目标并快速识别和解决日益复杂的IT环境中的问题。
Gartner高级总监分析师Padraig Byrne说:“ AIOps将检测出人类不太可能发现的模式,包括那些揭示因果关系的模式。在确定因果关系之后,应该创建模型,以帮助确定哪些IT指标。应该映射到哪个业务目标。随着时间的推移观察这些以完善每个模型;确保它是最新的,并确保它所做的任何假设都正确。通过使用机器学习算法,AIOps特别提供了一种数学方法来查找使该过程成为可能的数据中隐藏的联系,原因和机会。”
New Relic产品营销总监Michael Olson告诉我们,随着IT环境和驱动它们的软件的扩展和现代化,“需要管理的范围很广,这些团队正在收到越来越多的警报要处理,这使得很难对最重要的问题进行优先排序,将信号与噪音分开,并专注于对采取行动最重要的问题。”
简而言之,AIOps需要变得更聪明。
他说:“这实际上是我们看到New Relic AI能够提供帮助的地方,通过分析您可以从多个来源获取的数据,将彼此相关的警报,事件和事件进行分组和关联,以及,最终……帮助我们的客户专注于最高优先级的问题。” 他说,抢先体验的客户报告称,警报噪音和“警报疲劳”降低了50%以上。
该公司将New Relic AI描述为“一个开放的事件关联和情报解决方案,它与源和数据无关”,并利用了New Relic的统一遥测数据库,该数据库为ML模型提供了动力,并提供了“上下文关联事件响应工作流程”,可减少警报噪声。
奥尔森说,New Relic AI的一项关键功能是将其集成到现有管理工作流程中,例如Slack,PagerDuty,ServiceNow,OpsGenie,VictorOps和其他广泛使用的工具。该公司表示,客户可以实时查看摄取的数据,事件摘要,并可以“根据用户反馈调整相关性”。
遥测数据不断通过New Relic AI馈送以进行异常检测。据该公司称,该平台可提取,分析多种数据类型并采取行动,包括警报,日志,指标和部署事件,从而为“团队提供更好的事件背景信息……以及它们如何影响更广泛的环境,以便他们能够进行诊断和更快地确定问题的优先级。”
该公司表示,通过关联相关的警报,事件和事件,减少了警报噪声,同时“还抑制了震荡和低优先级警报。关联事件丰富了上下文,并根据黄金信号(即错误,饱和度,流量,等待时间)自动分类,并识别受影响的相关组件并建议响应者,以帮助待命团队更接近根本原因并更快采取行动。”
Olson补充说,New Relic AI旨在提高透明度。
他说:“我们为客户提供了极大的透明度和灵活性,并控制了事件之间的关联方式……然后,我们实际上为客户提供了灵活性和控制力,以便能够将其自己的系统注入到系统中。人为决定并调整相关逻辑。这样一来,我们的客户就能够更好地了解问题之间的相关性,并最终对系统产生更高的信任度。”
标签: AIOps平台