文档中心MogDBMogDB StackUqbar

文档:v6.3

支持的版本:

告警模板

告警模板

功能入口

告警中心--> 告警模板

功能说明

告警模板包含主机和MogDB/openGauss数据库告警检查信息。可以进行创建、修改、删除、克隆等操作。

操作指南

创建告警模板

点击右上“创建”按钮,输入告警模板名称、描述,选择告警对象类型,如下图:

img

img

点击“修改“可查看告警模板详情,如下图:

img

img

关联告警对象

为告警模板关联告警对象(主机或者数据库),每个告警类型的告警模板只能选择对应类型的对象(主机、MogDB/openGauss等),每个模板可以关联多个对象,每个对象只能关联一个模板。可以根据目标对象具体情况,创建多个告警模板,分别进行阈值配置。

img

img

对于主机类型的告警模板,告警对象以项目组方式分组:当主机上有已纳的数据库时,该主机归于数据库所在项目组。

主机上运行多个数据库分别属于不同项目组时,该主机会同时出现在各个项目组中。对于未纳管数据库的主机,则显示在“未分组”中。用户所能看到的主机对象将受项目组限制, 且该用户角色权限需要包含“监控所有主机”的资源权限,如下图:

img

告警通知设置

设置重复发送策略,默认重复通知间隔是10分钟,接收次数默认为不限制,如下图:

img

img

为告警模板关联告警联系人或组,配置了第三方告警消息发送通道后,触发告警时自动发送到关联告警人(邮箱或者手机)。

告警触发时,会首先向告警联系人发送消息,当联系人进行了响应或未响应时间超过设置的超时时间后,会向响应/超时联系人发送通知。

选择告警联系人或告警联系组:当告警对象为数据库类型时,还可以勾选同步将告警发送给项目组成员。

img

img

设置活动告警超时策略,修改后的策略只对新告警生效,如下图:

img

img

告警恢复通知设置,若开启了“发送恢复通知”,恢复通知发送给接收过告警通知的接收方,如下图:

img

调整告警项

在告警模板详情页下方展示了告警模板中的告警项,如下图:

img

预定义告警

点击“开启状态”可以启用或者停用告警项,如下图:

img

点击修改容忍时间、生效时间等,如下图:

img

点击告警项,右侧弹出该告警设置页面,可对单个告警项进行设置,如下图:

img

自定义告警

参见自定义功能“自定义告警”。

img

配置告警降噪

控制告警触发频率,降低告警消息发送频率,提高告警信任度。

平台第一次触发告警时间 <=指标采集时间(定时触发,触发告警时会小于等于该值) + 告警项容忍时间(告警持续时间,避免误告警) + 告警通知间隔(告警等待分组,降低告警资源);

平台第二次触发告警时间 >=指标采集时间 + 告警项容忍时间 + 通知间隔 + 重复通知间隔(当重复通知间隔时间不满足整n次采集频率时会推迟到下一个指标采集时间);

平台告警自动恢复时间<=指标采集时间 + 告警项容忍时间;

指标采集时间:每个指标采集频率均可不同,可分为高频(10s-30s)、中频(30s-10m)、低频(10m-20m)三个频级,在告警项下面可查看到具体采集频率;

在预定义告警页面,点击告警项,右侧弹出该告警设置页面,如下图:

img

容忍时间:每个告警项均可独立设置,持续满足上述所设置的阈值条件多少秒后告警才会触发;

生效时间:每个告警项均可独立设置,在设置时间段内告警策略才生效;

img

通知间隔:分组等待时间,当首次结束到告警时,会等待其他告警进来,超过这个时间内为同一个分组。降低平台告警资源占用,默认不用调整。

重复通知间隔:控制重复告警发送频率,如果告警第一次触发到第二次触发的时间,小于等于重复通知间隔时间,则平台不触发告警,不发送新的告警消息,原告警消息次数不变;

如果告警第一次触发到第二次触发的时间,大于重复通知间隔时间,则平台触发告警;如果第一次的告警消息状态已进行自动恢复、手动恢复或者手动忽略时,则发送新的告警消息(生成新的首次告警时间,第三方告警通道按告警模板设置发送,不受第一次告警消息响应设置影响),原告警消息次数不变;如果第一次的告警消息状态不变(包括响应和未响应),则发送告警消息(首次告警时间不变,第三方告警通道按第一次告警信息的响应规则发送),原告警消息次数+1;

判断告警是否自动恢复的时间不受该间隔时间控制,当指标采集时间+告警项容忍时间仍没有触发告警阈值时则判断告警已经恢复,自动重置告警消息为“已恢复”。

删除告警模板

点击“删除“可删除告警模板,如下图:

img

克隆告警模板

告警模板支持复制克隆;在告警模板列表中,选择需要克隆的告警模板,点击「克隆」打开「克隆弹窗」,如下图:

img

  1. 每次克隆,模版名称会自动在原有名称基础上,增加_copy后缀生成新的模板名称,支持手动修改模板名称;
  2. 对象类型默认继承原有模版的对象类型,支持手动修改对象类型,需要注意的是:如跨对象类型克隆,则不会克隆告警项相关配置;
  3. 描述默认继承原有模版的描述内容,支持手动修改;

未绑定告警的实例展示及绑定

当纳管的数据库未绑定任何告警模版时,在总览页面会有数字统计提醒,点击后下钻至告警模版页面,如下图:

img

告警模版页面,会按数据库展示未绑定告警的数据库数量,hover后可以查看详情,点击后在弹窗内快速绑定告警模版,如下图:

img

img

自定义阈值方案

功能入口

告警中心--> 告警模板-->自定义阈值方案

功能说明

对指定告警对象的指定告警项配置单独的阈值方案,其优先级将高于模版中的阈值方案。

操作指南

自定义阈值方案页面包括对象类型、告警项、告警对象、子对象、阈值配置,按照对象类型和告警项来排序,可以按照告警项、对象来模糊查询,如下图:

img

点击创建,窗口右侧弹出设置界面,如下图:

img

选择对象类型,包括各类数据库和主机;

选择某类数据库后,可以单选数据库,单选告警项,每个告警项都可以配置该告警项的阈值,包括每个数据库告警里的那六个主机告警项;

选择主机后,可以单选主机,单选告警项,每个告警项都可以配置该告警项的阈值;

img

选择告警项,根据告警项(预定义和自定义)里的3、4级标签设置,将可以指定子对象;可以指定多组子对象;每个子对象都可以配置阈值;

子对象1(告警项配置带过来的名称),比如填写数据库名称,可选择“不限制”;

子对象2(告警项配置带过来的名称),比如填写表空间名称,可选择“不限制”;

img

选择告警对象,告警对象加上告警项不可重复;

同一个告警项和告警对象内的子对象不可重复;

img

添加方案时,默认的阈值从自定义告警项带过来,如下图:

img

点击策略可以滑出界面,可以修改,如下图:

img

点击删除,删除策略,删除后会使用模板中的该对象的该告警项的阈值策略,如下图:

img

Copyright © 2011-2024 www.enmotech.com All rights reserved.