功能介绍
功能介绍
-
智能降噪
-
动态阈值
-
告警日志联动
-
提前预警
客户案例
银行交易压力波动大,
AnyRobot 算法实现动态阈值,减少误报、漏报
问题:
- 股份制商业银行的密码修改业务的交易量随时间分布非常不平均
- 多次调整告警阈值仍反复出现低谷时间段漏报(交易量波动始终不超过阈值)和高峰时间段误报(交易量在阈值附近震荡,反复引发告警)
方案:
- 运维人员为该业务应用设定了动态阈值,通过算法计算一段时间内的业务压力来降低影响,减少误报
价值:
- 降低高峰时的误报
- 减少低谷时的漏报
- 运维处理效率更高
AD 认证失败,及时敲响账户攻击的警报,
让运维人员快速接警
问题:
- 传统查找,费时费力
- 希望快速找到原因,减少业务影响范围
方案:
- 告警日志关联,根据告警查看原始日志,以及查看日志的上下文
价值:
- 快速定位日志,找到问题原因
- 减少业务宕机时间
某成长型企业线上业务的 SLO 监控分析,
提前预警,降低业务风险
问题:
- 存在隐患,不能及时发现,导致业务故障
- 故障事后处理,业务影响范围大
方案:
- 服务健康度分析,基于服务分值提前预警,将隐患消灭在萌芽状态,保障业务的长期稳定运行
价值:
- 提前发现故障,降低业务中断风险
- 为整体服务可用性提供度量指标
客户案例
银行交易压力波动大,
AnyRobot 算法实现动态阈值,减少误报、漏报
问题:
- 股份制商业银行的密码修改业务的交易量随时间分布非常不平均
- 多次调整告警阈值仍反复出现低谷时间段漏报(交易量波动始终不超过阈值)和高峰时间段误报(交易量在阈值附近震荡,反复引发告警)
方案:
- 运维人员为该业务应用设定了动态阈值,通过算法计算一段时间内的业务压力来降低影响,减少误报
价值:
- 降低高峰时的误报
- 减少低谷时的漏报
- 运维处理效率更高
AD 认证失败,及时敲响账户攻击的警报,
让运维人员快速接警
问题:
- 传统查找,费时费力
- 希望快速找到原因,减少业务影响范围
方案:
- 告警日志关联,根据告警查看原始日志,以及查看日志的上下文
价值:
- 快速定位日志,找到问题原因
- 减少业务宕机时间
某成长型企业线上业务的 SLO 监控分析,
提前预警,降低业务风险
问题:
- 存在隐患,不能及时发现,导致业务故障
- 故障事后处理,业务影响范围大
方案:
- 服务健康度分析,基于服务分值提前预警,将隐患消灭在萌芽状态,保障业务的长期稳定运行
价值:
- 提前发现故障,降低业务中断风险
- 为整体服务可用性提供度量指标
技术优势
97% 降噪率
- 高达 97% 的降噪率,消除大部分告警噪声
- 便于运维工程师集成精力解决重要问题
处理高效
- 写入优化:将多种运维日志汇聚在一个平台上,包括:网络设备、安全设备、存储、操作系统、中间件等,一键搜索
- 性能优化:TB 级数据搜索秒级响应
- 搜索优化:把多个相互独立事情串联,展示完整事件流程
智能算法
- 内置几十种机器学习算法,通过文本相似度识别实现降噪
精准告警
- 基于动态阈值的告警,大大减少误报和漏报,让运维人员更专注于高危事件
问题定位
- 通过告警日志联动详情,快速定位日志的上下文,有利于运维工程师快速排障
提前预警
- 业务链路建立健康度分析,对业务整体有个全局性的健康度量值
- 能够在业务系统故障早期发现问题,再依靠对全链路的拓扑监控和定位能力,及时排除问题,进而有效保障业务系统持续稳定运行
技术优势
97% 降噪率
- 高达 97% 的降噪率,消除大部分告警噪声
- 便于运维工程师集成精力解决重要问题
处理高效
- 写入优化:将多种运维日志汇聚在一个平台上,包括:网络设备、安全设备、存储、操作系统、中间件等,一键搜索
- 性能优化:TB 级数据搜索秒级响应
- 搜索优化:把多个相互独立事情串联,展示完整事件流程
智能算法
- 内置几十种机器学习算法,通过文本相似度识别实现降噪
精准告警
- 基于动态阈值的告警,大大减少误报和漏报,让运维人员更专注于高危事件
问题定位
- 通过告警日志联动详情,快速定位日志的上下文,有利于运维工程师快速排障
提前预警
- 业务链路建立健康度分析,对业务整体有个全局性的健康度量值
- 能够在业务系统故障早期发现问题,再依靠对全链路的拓扑监控和定位能力,及时排除问题,进而有效保障业务系统持续稳定运行