数字化进程加速,虚拟化、集群化、云化、微服务化的敏态架构全面支撑数字化业务建设,组织业务系统建设复杂,各个服务之间的调用关系多重依赖。一个服务异常往往引起多重设备和系统故障,组织运营存在潜在的业务风险和安全隐患。 全面数字化时代,传统的监控告警工具和故障处理方式已成为数字化业务系统高效稳定运营的“老大难“。 l 实时告警难:现有监控告警工具迫于系统持续稳定运行的要求,告警通知不及时,导致业务运营缓慢或中断,存在业务宕机风险; l 海量告警信息处理难:单一告警规则设定下,监控越精准,告警规则设定越多。一旦有告警产生,运维人员就淹没在海量告警信息中,故障处理效率低下; l 告警故障根源定位难:跨系统应用的监控指标多重依赖,无法快速排查关键告警,难以快速定位故障根源; l 告警信息管理难:告警规则复杂多变,运维人员很难对告警规则进行快速、灵活管理,并且难以将告警规则快速应用于多种告警场景,造成运维管理成本增加。