Prometheus配置告警规则

技术Prometheus配置告警规则 Prometheus配置告警规则https://www.cnblogs.com/linuxk/p/12036193.html修改prometheus配置文件指定pr

普罗米修斯配置告警规则

https://www.cnblogs.com/linuxk/p/12036193.html

修改普罗米修斯配置文件

指定prometheus的规则文件路径或者文件名

vim prometheus.yml

rule_files:

-“规则/* _规则。yml "

# -'普罗米修斯_rules.yml '

# - './rule/* .yaml '

# - 'first_rules.yml '

# - 'second_rules.yml '

乔恩河普罗米修斯:普罗米修斯/opt/普罗米修斯/规则/

mv prometheus_rules.yml rules/

此配置所有规则都写入一个文件里面。

重启普罗米修斯

重启普罗米修斯系统

journalctl -u prometheus -fn 200

#停止

# PS-ef | grep promethes | grep-v grep | awk " { print $ 2 } " | xagrs kill-9

#或者

# curl-XPOST http://localhost :9090/-/退出

#重载

# curl-XPOST http://localhost :9090/-/reload

精力普罗米修斯_rules.yml

组:

-活着的名字:

规则:

-记录:节点: ping :总数

expr:向上

-名称为:中央处理器

规则:

-记录:节点: CPU _使用率:比率#别的文件使用,直接使用这个

expr: ((100 -(平均值乘(实例、ip、主机名))(气呼呼的(node _ CPU _ seconds _ total { mode=' idle ' }[5m])* 100))

-名称: mem

规则:

-记录:节点:内存_使用率:比率

expr :(100-(node _ memory _ MemTotal _ bytes-node _ memory _ MemFree _ bytes node _ memory _ Buffers _ bytes node _ memory _ Cached _ bytes)/node _ MemTotal _ bytes * 100)

检查配置

[根@普罗米修斯普罗米修斯]# ./promtool检查配置普罗米修斯. yml

正在检查普罗米修斯。阳明海运股份有限公司

成功: 1找到规则文件

正在检查普罗米修斯_rules.yml

失败:

普罗米修斯规则。yml :组名:“活着”在同一文件中重复出现

重启普罗米修斯系统

journalctl -u prometheus -fn 200

精力规则/disk_rules.yml

组:

-名称:磁盘监视器

规则:

-警报: hostoutofdisksspace

expr :(node _ file system _ avail _ bytes * 100)/node _ file system _ size _ bytes { job=' node ',fstype=~'ext .*|xfs ',挂载点='/'} 30和开(实例、设备、挂载点)节点_文件系统_只读==0

:米

标签:

严重:警告

注释:

摘要:主机磁盘空间不足(实例{ { $标签.实例}})

描述:"磁盘快满了(还剩30%)\ n值={ $ VALUE } } \ n标签={ { $ LABELS } } "

精力规则/cpu_rules.yml

组:

-名称为: CPU-监视器

规则:

-警报: hosthighlipuload

expr: 100 -(平均值乘以(实例)(速率(node _ CPU _ seconds _ total { mode=' idle ' }[2m])* 100)80

:米

标签:

严重:警告

注释:

摘要:主机高中央处理器负载(实例{ { $标签.实例}})

#描述:英寸CPU负载为80% \ n值={ { $ VALUE } } \ n标签={ { $ LABELS } } "

描述: '服务器5分钟内中央处理器使用率超过80%!(当前值' : {{ $value }}%)'

精力规则/alertmanager_rules.yml

组:

-名称:警报管理器-监视器

规则:

-警报: PrometheusNotConnectedToAlertmanager

expr :普罗米修斯_通知_警报管理器_发现1

:米

标签:

严重程度:严重

注释:

摘要:普罗米修斯未连接到警报管理器(实例{ { $标签.实例}})

描述:"普罗米修斯无法连接警报管理器\ n值={ { $ VALUE } } \ n标签={ { $ LABELS } } "

精力规则/memory_rules.yml

组:

-名称:内存监视器

规则:

- alert: HostOutOfMemory

expr : node _ memory _ MemAvailable _ bytes/node _ memory _ MemTotal _ bytes * 100 20

:平方米

标签:

严重:警告

注释:

摘要:主机内存不足(实例{ { $标签.实例}})

描述:"节点内存已满(剩余20%)\ n值={ $ VALUE } } \ n标签={ $ LABELS } } "

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/112506.html

(0)

相关推荐

  • 如何利用okhttp框架实现包含验证码的用户登录并保持session操作

    技术如何利用okhttp框架实现包含验证码的用户登录并保持session操作小编给大家分享一下如何利用okhttp框架实现包含验证码的用户登录并保持session操作,相信大部分人都还不怎么了解,因此分享这篇文章给大家参

    攻略 2021年11月18日
  • 分享Python练手小项目

    技术分享Python练手小项目本篇内容介绍了“分享Python练手小项目”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!1

    攻略 2021年10月22日
  • springboot怎么动态获取配置啊(springboot控制器参数默认值设置)

    技术怎么使用springboot获取控制器参数小编给大家分享一下怎么使用springboot获取控制器参数,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了

    攻略 2021年12月17日
  • 学习CSS布局的理由具体有哪些

    技术学习CSS布局的理由具体有哪些学习CSS布局的理由具体有哪些,相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。这里向大家描述一下CSS布局的10大理由,虽然

    攻略 2021年11月17日
  • SpringBoot中常用的注解有哪些

    技术SpringBoot中常用的注解有哪些这篇文章主要介绍了SpringBoot中常用的注解有哪些,具有一定借鉴价值,感兴趣的朋友可以参考下,希望大家阅读完这篇文章之后大有收获,下面让小编带着大家一起了解一下。一、@Sp

    攻略 2021年12月11日
  • 汇编语言怎么实现简单数学运算

    技术汇编语言怎么实现简单数学运算这篇文章主要介绍“汇编语言怎么实现简单数学运算”,在日常操作中,相信很多人在汇编语言怎么实现简单数学运算问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”汇编语

    攻略 2021年11月29日