AnyRobot Eyes 5.0.0.3 版本发布
本次发布 AnyRobot Eyes 5.0.0.3 版本,具体发布内容如下:
一、新增灾备任务异常告警模板:帮助运维人员及时发现备份任务执行问题,保证灾备体系健康。具体可分类为以下几个告警场景:
1、备份任务状态异常
例如:任务最近一次执行状态为失败,并于1小时内任务异常状态个数 >0 次,原因可能是备份任务执行异常,从而导致备份任务执行失败,影响备份任务恢复,此时应登录到 AnyBackup 平台排查原因;
2、备份任务长时间未执行告警
例如:最近一次执行任务的时间距当前时间超过 24 小时未执行,并于 1 小时内,发现任务执行时间差 > 1 小时,原因可能是任务未设置备份策略,或任务未按时执行出现异常,从而导致备份任务未按时执行,影响了备份任务的恢复,此时应登录到 AnyBackup 平台排查原因;
3、备份策略未设置/策略保留副本数未设置
例如:于 1 小时内发现任务未设置备份策略,原因可能是备份任务中的备份策略被解绑或任务未设置备份策略,从而导致备份任务未按时执行,影响备份任务恢复,此时应登录到 AnyBackup 平台排查原因;
4、任务容量超过阈值
例如:于 1 小时内,任务所占容量超过了 1TB,原因可能是备份任务执行时间过长,引发备份数据所占空间过大,从而导致备份空间浪费,此时应登录到 AnyBackup 平台,清除部分备份副本

图 1灾备任务异常告警模板

图 2 告警模板邮件提醒示例
【云原生应用可观测性】
二、支持记录 TelemetrySDK 事件数据并上报至 AnyRobot : 为不同的业务系统提供一致的事件数据模型和统一的事件数据埋点方式,并支持基于事件数据的查询和分析
【智能告警】
三、新增告警通知模板管理:
1、用户可以对通知模板进行新增、上传、预览、编辑、删除等管理操作,支持通知模板复用,用户可以在配置告警规则时绑定通知模板;
2、指标告警、实时告警均支持使用包括邮件、短信、企业微信、HTTP 转发、Syslog 转发等告警通知方式,来选择不同的模板内容进行通知传达;

图3 告警通知模板管理
【SuperAgent】
四、提供数据接收器,支持接收事件数据:用户可以使用 TelemetrySDK 导出事件数据并上传到 AnyRobot
【机器数据湖】
五、UniQuery PromQL 查询支持 _over_time 算子:对各时间序列在时间区间内的所有样本值做聚合计算,支持的区间聚合计算函数有 avg_over_time 、sum_over_time 、max_over_time 、min_over_time 、count_over_time。例如,运用 avg_over_time 来计算 OpenSearch 15 分钟的堆平均使用率,如下图:

图4运用 avg_over_time 来计算 Opensearch 15 分钟的堆平均使用率
六、UniQuery PromQL 查询支持 floor、ceil、abs、exp、sqrt、 ln 、log2 、log10 数学函数。例如,运用 floor 结合 increase 来计算 MongoDB 当前时间段主节点选取的次数:

图5 运用 floor 结合 increase 来计算 MongoDB 当前时间段主节点选取的次数
【大屏可视化】
七、两地三中心灾备大屏支持帆软 11 版本

图 6 智能灾备运维两地三中心大屏—帆软 11 版
八、灾备大屏支持自定义数据中心数量:用户可通过灵活自定义配置数据中心,满足灾备系统场景中的不同数量数据中心的场景

图 7 灾备大屏 5 个数据中心场景示意图
【可视化及仪表盘】
九、Grafana 仪表盘支持按正则匹配显示根分组列表:在原 Grafana 仪表盘支持精确匹配根日志分组的基础上,提升了根日志分组查询的灵活性

图 8 Grafana 仪表盘支持按正则匹配显示根分组列表
【场景分析模板】
此版本将场景分析模板优化为 8 个目录进行收集,分别为:灾备可观测性、云基础设施可观测性、网络设备、应用、数据库、中间件、安全设备和操作系统,增强了实施人员对于模板选取运用的理解性和便捷性

图 9 场景分析模板目录优化
【Bug修复】
1、修复主页仪表盘时间范围变化,下拉过滤器枚举值不变的问题;
2、修复仪表盘图中【刻度划分阶段数量】选项不生效的问题;
3、修复在对象管理中删除告警规则报错的问题;
4、修复对象管理中查看告警无效的问题;
5、修复指标告警页面无法正常跳转到日志分组管理页面的问题;
6、修复告警通知模板编辑添加多个回车保存后只剩一个回车的问题;
7、修复指标告警中告警分组设置下拉框不固定的问题;
8、修复告警模板选择通知模板的下拉栏不固定的问题;
9、修复 irate 算子偶现单独查询存在数据返回,与四则运算或者 ignoring、with 等连用时返回空白的问题;
10、修复权限管理勾选解析规则后,勾选导入和导出全部,再取消勾选解析规则保存,用户拥有导入和导出全部的权限的问题;
11、修复优化日志导出默认命名不是具有可读性的常规时间,未能提升使用体验的问题;
12、修复不具有解析规则权限的非 admin 用户可通过数据库连接关联对象跨权编辑解析规则的问题;
13、修复新建角色后赋对象管理权限,对象管理子权限不完整的问题;
14、修复用户管理、角色管理序号超过一页时,新建用户或角色后,跳转到第二页,页面内容会跳转回第一页的问题;
15、修复数据转发点击开关,任务状态没有及时刷新的问题。
【重大价值特性】
【灾备可观测性】一、新增灾备任务异常告警模板:帮助运维人员及时发现备份任务执行问题,保证灾备体系健康。具体可分类为以下几个告警场景:
1、备份任务状态异常
例如:任务最近一次执行状态为失败,并于1小时内任务异常状态个数 >0 次,原因可能是备份任务执行异常,从而导致备份任务执行失败,影响备份任务恢复,此时应登录到 AnyBackup 平台排查原因;
2、备份任务长时间未执行告警
例如:最近一次执行任务的时间距当前时间超过 24 小时未执行,并于 1 小时内,发现任务执行时间差 > 1 小时,原因可能是任务未设置备份策略,或任务未按时执行出现异常,从而导致备份任务未按时执行,影响了备份任务的恢复,此时应登录到 AnyBackup 平台排查原因;
3、备份策略未设置/策略保留副本数未设置
例如:于 1 小时内发现任务未设置备份策略,原因可能是备份任务中的备份策略被解绑或任务未设置备份策略,从而导致备份任务未按时执行,影响备份任务恢复,此时应登录到 AnyBackup 平台排查原因;
4、任务容量超过阈值
例如:于 1 小时内,任务所占容量超过了 1TB,原因可能是备份任务执行时间过长,引发备份数据所占空间过大,从而导致备份空间浪费,此时应登录到 AnyBackup 平台,清除部分备份副本

图 1灾备任务异常告警模板

图 2 告警模板邮件提醒示例
【云原生应用可观测性】
二、支持记录 TelemetrySDK 事件数据并上报至 AnyRobot : 为不同的业务系统提供一致的事件数据模型和统一的事件数据埋点方式,并支持基于事件数据的查询和分析
【智能告警】
三、新增告警通知模板管理:
1、用户可以对通知模板进行新增、上传、预览、编辑、删除等管理操作,支持通知模板复用,用户可以在配置告警规则时绑定通知模板;
2、指标告警、实时告警均支持使用包括邮件、短信、企业微信、HTTP 转发、Syslog 转发等告警通知方式,来选择不同的模板内容进行通知传达;

图3 告警通知模板管理
【SuperAgent】
四、提供数据接收器,支持接收事件数据:用户可以使用 TelemetrySDK 导出事件数据并上传到 AnyRobot
【机器数据湖】
五、UniQuery PromQL 查询支持 _over_time 算子:对各时间序列在时间区间内的所有样本值做聚合计算,支持的区间聚合计算函数有 avg_over_time 、sum_over_time 、max_over_time 、min_over_time 、count_over_time。例如,运用 avg_over_time 来计算 OpenSearch 15 分钟的堆平均使用率,如下图:

图4运用 avg_over_time 来计算 Opensearch 15 分钟的堆平均使用率
六、UniQuery PromQL 查询支持 floor、ceil、abs、exp、sqrt、 ln 、log2 、log10 数学函数。例如,运用 floor 结合 increase 来计算 MongoDB 当前时间段主节点选取的次数:

图5 运用 floor 结合 increase 来计算 MongoDB 当前时间段主节点选取的次数
【大屏可视化】
七、两地三中心灾备大屏支持帆软 11 版本

图 6 智能灾备运维两地三中心大屏—帆软 11 版
八、灾备大屏支持自定义数据中心数量:用户可通过灵活自定义配置数据中心,满足灾备系统场景中的不同数量数据中心的场景

图 7 灾备大屏 5 个数据中心场景示意图
【可视化及仪表盘】
九、Grafana 仪表盘支持按正则匹配显示根分组列表:在原 Grafana 仪表盘支持精确匹配根日志分组的基础上,提升了根日志分组查询的灵活性

图 8 Grafana 仪表盘支持按正则匹配显示根分组列表
【场景分析模板】
此版本将场景分析模板优化为 8 个目录进行收集,分别为:灾备可观测性、云基础设施可观测性、网络设备、应用、数据库、中间件、安全设备和操作系统,增强了实施人员对于模板选取运用的理解性和便捷性

图 9 场景分析模板目录优化
【Bug修复】
1、修复主页仪表盘时间范围变化,下拉过滤器枚举值不变的问题;
2、修复仪表盘图中【刻度划分阶段数量】选项不生效的问题;
3、修复在对象管理中删除告警规则报错的问题;
4、修复对象管理中查看告警无效的问题;
5、修复指标告警页面无法正常跳转到日志分组管理页面的问题;
6、修复告警通知模板编辑添加多个回车保存后只剩一个回车的问题;
7、修复指标告警中告警分组设置下拉框不固定的问题;
8、修复告警模板选择通知模板的下拉栏不固定的问题;
9、修复 irate 算子偶现单独查询存在数据返回,与四则运算或者 ignoring、with 等连用时返回空白的问题;
10、修复权限管理勾选解析规则后,勾选导入和导出全部,再取消勾选解析规则保存,用户拥有导入和导出全部的权限的问题;
11、修复优化日志导出默认命名不是具有可读性的常规时间,未能提升使用体验的问题;
12、修复不具有解析规则权限的非 admin 用户可通过数据库连接关联对象跨权编辑解析规则的问题;
13、修复新建角色后赋对象管理权限,对象管理子权限不完整的问题;
14、修复用户管理、角色管理序号超过一页时,新建用户或角色后,跳转到第二页,页面内容会跳转回第一页的问题;
15、修复数据转发点击开关,任务状态没有及时刷新的问题。
赞
点个赞吧!
请就本文对您的益处进行评级: