普罗米修斯配置告警规则
https://www.cnblogs.com/linuxk/p/12036193.html
修改普罗米修斯配置文件
指定prometheus的规则文件路径或者文件名
vim prometheus.yml
rule_files:
-“规则/* _规则。yml "
# -'普罗米修斯_rules.yml '
# - './rule/* .yaml '
# - 'first_rules.yml '
# - 'second_rules.yml '
乔恩河普罗米修斯:普罗米修斯/opt/普罗米修斯/规则/
mv prometheus_rules.yml rules/
此配置所有规则都写入一个文件里面。
重启普罗米修斯
重启普罗米修斯系统
journalctl -u prometheus -fn 200
#停止
# PS-ef | grep promethes | grep-v grep | awk " { print $ 2 } " | xagrs kill-9
#或者
# curl-XPOST http://localhost :9090/-/退出
#重载
# curl-XPOST http://localhost :9090/-/reload
精力普罗米修斯_rules.yml
组:
-活着的名字:
规则:
-记录:节点: ping :总数
expr:向上
-名称为:中央处理器
规则:
-记录:节点: CPU _使用率:比率#别的文件使用,直接使用这个
expr: ((100 -(平均值乘(实例、ip、主机名))(气呼呼的(node _ CPU _ seconds _ total { mode=' idle ' }[5m])* 100))
-名称: mem
规则:
-记录:节点:内存_使用率:比率
expr :(100-(node _ memory _ MemTotal _ bytes-node _ memory _ MemFree _ bytes node _ memory _ Buffers _ bytes node _ memory _ Cached _ bytes)/node _ MemTotal _ bytes * 100)
检查配置
[根@普罗米修斯普罗米修斯]# ./promtool检查配置普罗米修斯. yml
正在检查普罗米修斯。阳明海运股份有限公司
成功: 1找到规则文件
正在检查普罗米修斯_rules.yml
失败:
普罗米修斯规则。yml :组名:“活着”在同一文件中重复出现
重启普罗米修斯系统
journalctl -u prometheus -fn 200
精力规则/disk_rules.yml
组:
-名称:磁盘监视器
规则:
-警报: hostoutofdisksspace
expr :(node _ file system _ avail _ bytes * 100)/node _ file system _ size _ bytes { job=' node ',fstype=~'ext .*|xfs ',挂载点='/'} 30和开(实例、设备、挂载点)节点_文件系统_只读==0
:米
标签:
严重:警告
注释:
摘要:主机磁盘空间不足(实例{ { $标签.实例}})
描述:"磁盘快满了(还剩30%)\ n值={ $ VALUE } } \ n标签={ { $ LABELS } } "
精力规则/cpu_rules.yml
组:
-名称为: CPU-监视器
规则:
-警报: hosthighlipuload
expr: 100 -(平均值乘以(实例)(速率(node _ CPU _ seconds _ total { mode=' idle ' }[2m])* 100)80
:米
标签:
严重:警告
注释:
摘要:主机高中央处理器负载(实例{ { $标签.实例}})
#描述:英寸CPU负载为80% \ n值={ { $ VALUE } } \ n标签={ { $ LABELS } } "
描述: '服务器5分钟内中央处理器使用率超过80%!(当前值' : {{ $value }}%)'
精力规则/alertmanager_rules.yml
组:
-名称:警报管理器-监视器
规则:
-警报: PrometheusNotConnectedToAlertmanager
expr :普罗米修斯_通知_警报管理器_发现1
:米
标签:
严重程度:严重
注释:
摘要:普罗米修斯未连接到警报管理器(实例{ { $标签.实例}})
描述:"普罗米修斯无法连接警报管理器\ n值={ { $ VALUE } } \ n标签={ { $ LABELS } } "
精力规则/memory_rules.yml
组:
-名称:内存监视器
规则:
- alert: HostOutOfMemory
expr : node _ memory _ MemAvailable _ bytes/node _ memory _ MemTotal _ bytes * 100 20
:平方米
标签:
严重:警告
注释:
摘要:主机内存不足(实例{ { $标签.实例}})
描述:"节点内存已满(剩余20%)\ n值={ $ VALUE } } \ n标签={ $ LABELS } } "
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/112506.html