AnyRobot Family 5.0.1.11 版本发布
本次发布 AnyRobot Family 5.0.1.11 版本,具体发布内容如下:
【灾备可观测性】
一、AnyBackup 8—新增客户端状态监控:
1、亮点功能:支持从数据中心、网系、操作系统类型、客户端类型、客户端、IP地址、客户端状态、分配用户类型、分配用户等维度,对客户端的总数、在线数、离线数、分配用户数等指标进行聚合统计,来帮助灾备管理员快速了解灾备系统客户端的整体运行情况,提高灾备运营效率。

图 1 AnyBackup 8客户端状态监控
二、AnyBackup 8—优化租户任务分析:
1、亮点功能:新增“租户-备份任务列表”,支持查看租户给保护对象配置的任务数、作业数,可以帮助灾备管理员快速了解所有租户的任务配置情况以及执行情况,提高灾备运营效率。

图 2 AnyBackup 8租户任务分析优化
【操作系统全息观测】
三、Linux观测—支持指标告警:
1、亮点功能:支持对内存利用率、CPU利用率、系统盘利用率、磁盘IO利用率、1分钟/5分钟/15分钟平均负载等Linux系统核心指标进行监控告警,可以帮助运维人员及时发现、预警Linux系统运行异常情况,保证业务系统的正常运行。

图 3 Linux观测支持指标告警
四、Linux观测—优化分析模板:
1、亮点功能:
(1)优化仪表盘组织方式,根据场景拆分为性能剖析、资源剖析、进程剖析三个仪表盘,可以帮助运维人员,快速定位主机异常,提升排障效率;

图 4 Linux观测仪表盘组织方式优化

图 5 Linux性能剖析

图 6 Linux资源剖析
(2)在进程剖析中,新增主机进程详情列表,可以帮助运维人员精准定位主机中占用内存、CPU较高的进程服务,提升排障效率。

图 7 Linux进程剖析及详情列表
【数据库全息观测】
五、Redis观测:
1、新增Redis性能剖析:支持从实例、集群、总体概览维度,对Redis的内存使用、网络使用、Key命中、客户端请求等指标进程统计分析,来展示当前Redis资源、性能状况,从而帮助运维人员排查Redis资源性能问题。

图 8 Redis性能剖析
2、新增Redis哨兵监控:支持对Redis哨兵的哨兵总数、监控Master数量、哨兵状态等指标进行分析展示,来帮助运维人员排查和定位Redis哨兵问题。

图 9 Redis哨兵监控
3、新增Redis集群监控:支持对Redis集群的实例总数、宕机实例数、分片数、slot数量、实例详情、实例集群状态等指标进行分析展示,来帮助运维人员排查和定位Redis集群问题。

图 10 Redis集群监控
【SuperAgent】
六、系统指标采集器—优化指标采集项:
1、支持采集Linux主机操作系统时间、系统时区、进程IO相关指标;
2、进程相关指标增加 cmdline 标签,结合数据字典实现进程和服务的映射关联。
【自动监控】
七、告警通知:指标告警支持基于指标模型的数据告警。
【Proton及部署】
八、部署兼容性:新增AnyRobot Embedded 5
1、支持根据不同资源要求进行分级部署;
2、支持与爱数其他产品融合部署 (AnyShare);
3、支持通过部署工作台一键化部署及升级;
4、支持log、trace、metric等多种可观测性数据的采集、分析、存储;
软件更新:集成 Proton 2.9.0
1、支持移动云 BC-linux8.2 部署;
2、支持变更nginx-ingress-controller的网络模式;
3、支持达梦数据库;
4、内置 Feeder 接收器,用于接收采集器和AnyRobot自身服务可观测数据。
【AnyRobot Embedded 5】
九、AnyRobot Embedded 5是一款为AISHU产品提供内置可观测性能力的产品。该产品可提供数据采集、数据搜索查询、数据分析报表、告警通知等常见功能。以下为本次版本发布的特性支持内容:
1、AnyRobot Embedded 5—新增Linux观测:支持从性能、资源、进程资源等维度,对Linux系统的已用、可用、总量、利用率等指标进行统计分析,可以帮助运维人员快速分析定位Linux系统的性能和资源问题,提升Linux系统运维效率。
2、AnyRobot Embedded 5—新增Kubernetes 观测:
(1)支持从节点、状态等维度,对 Kubernetes Node 的总数、CPU、内存、Pods 数、磁盘IO、网络IO等指标进行统计分析,来帮助运维人员掌握 Kubernetes 集群节点的运行情况,定位资源异常问题。
(2)支持展示 Pod 及其容器的内存、CPU、网络、磁盘等资源分配情况和使用趋势,来满足运维管理员在应用排障、性能问题排查等场景中查看了解应用容器资源使用情况的需要。
3、AnyRobot Embedded 5—新增MariaDB 观测:
(1)支持从集群、节点、功能模块等多个维度,对MariaDB 的连接数、操作数、操作延迟、QPS、TPS、慢日志数等指标进行统计分析,来满足数据库管理员快速定位MariaDB 性能问题的需求场景。
(2)支持通过对 MariaDB 异常日志进行识别,并从集群、节点、异常级别、日志级别等多个维度对异常日志进行聚合统计、趋势分析及详情展示,来满足运维管理员快速定位MariaDB 异常原因的需要。
4、AnyRobot Embedded 5—新增MongoDB 观测:
(1)支持从集群、节点、功能模块等多个维度,对MongoDB 的连接数、操作数、操作延迟、QPS、TPS、慢日志数等指标进行统计分析,来满足数据库管理员快速定位MongoDB 性能问题的需求场景。
(2)支持通过对 MongoDB 异常日志进行识别,并从集群、节点、异常级别、日志级别等多个维度对异常日志进行聚合统计、趋势分析及详情展示,来满足运维管理员快速定位MongoDB 异常原因的需要。
5、AnyRobot Embedded 5—新增OpenSearch 观测:
(1)支持从集群、节点等维度,对 OpenSearch 的集群状态、节点数、节点状态、 分片、IM、存储空间、线程、缓存、慢查询等指标进行分析,满足 OpenSearch 管理员发现和定位性能问题的需求场景。
(2)支持通过对 OpenSearch 异常日志进行识别,并从集群、节点、异常级别、日志级别等多个维度对异常日志进行聚合统计、趋势分析及详情展示,来满足运维管理员快速定位 OpenSearch 异常原因的需要。
6、AnyRobot Embedded 5—应用软件观测:
(1)支持从应用名、实例名、日志级别等维度,对应用软件日志数进行统计分析,并支持通过查看异常日志关联链路数据,帮助运维人员排查异常发生的上下文环境、评估异常的影响范围。
(2)支持从应用名、实例名、请求状态请求接口 (HTTP)、客户端等维度,对应用软件的请求数、请求耗时等指标进行统计分析,并支持查看单次请求的链路数据以及关联日志,来帮助运维人员快速排查应用软件异常,提高排障效率。
【Bug修复】
1、修复AS70410+AR5018dm,使用达梦数据库,页面导入部分告警失败的问题;
2、修复ingest-manager数据库连接代码逻辑问题的问题;
3、修复执行器注册没有对执行器ID做校验的问题;
4、修复系统指标采集器创建任务数量限制无效的问题;
5、修复proton-prometheus无法获取logstash-input相关指标监控数据的问题;
6、修复频繁操作任务,导致job中的配置和数据库中配置不一致的问题;
7、修复无法支持label中包含有“=”场景的问题;
8、修复仪表盘中条形图范围值过滤报错的问题;
9、修复报表导出-pdf源文件,日期范围选择昨天,仪表盘内能查询到数据,导出的仪表盘为空的问题;
10、修复AnyRobot生产环境的告警模块,有一个json数据解码错误异常的问题;
11、修复AnyRobot 数据库表大小写问题处理的问题。