MONGO DB too many mongodb page_faults 报错排查step by step的示例分析

技术MONGO DB too many mongodb page_faults 报错排查step by step的示例分析这篇文章给大家介绍MONGO DB too many mongodb page_faults

本文介绍了Mongo DB太多MongoDB page _ faults错误报告的实例分析和逐步排除故障的方法。内容非常详细,有兴趣的朋友可以参考一下,希望对大家有所帮助。

早上,运维的同学,早上打来电话,说zabbix的MONGO监控到了报警。图片发给我,报告的错误是mongodb page_faults太多。

最初,page_faults的根本原因是MONGO瞬间从磁盘读取了大量数据,从而导致了page_faults。

此时,一些MONGO DBA会立即响应,查看是否有完整的COLLECION SCAN,因为没有好的索引,大量的扫描会导致这个问题。

但是这个问题的奇妙之处在于,报告错误的PAGE_FAULTS机器没有查询(不是主库)。既然没有查询,你是怎么得到page_faults的?

官方解释截图

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

立即确认刚启动的MONGO standy库是否存在page_faults问题。

这些是有问题的机器。(不要笑。新机器中肯定没有这么多页面错误。)

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

比较主机的page_faults。

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

果然,这个问题机有很多page_faults。

另外,看看内存状态。果然,SWAP已经被使用了。

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

通过mongostat查看,系统没有任何问题。

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

看着日志。

MONGO  DB  too  many  mongodb  page_faults   报错排查step  by  step的示例分析

可以看到日志已经指向了advisoryHostFQDNS,通过日志发现这个错误一直在发生,执行一个命令需要80秒。

经过查询,可能有几个原因,因为这个advisoryHostFQDNs是集群中每一台MONGODB机器的域名解析,这里查询的信息来自OPS MANANGER,说明我们这边域名解析可能存在一些问题。

这里解决问题的方法:填写每台机器上所有集群MONGODB和OPS MANANGE上HOSTS的机器名称,而不是通过DNS解析,看能否解决以上问题。

mongo db太多MongoDB page _ faults错误报告和逐步排除故障的示例分析在此分享,希望。

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/66426.html

(0)

相关推荐

  • MySQL中Innodb Handler_read_*参数分析

    技术MySQL中Innodb Handler_read_*参数分析这篇文章主要介绍“MySQL中Innodb Handler_read_*参数分析”,在日常操作中,相信很多人在MySQL中Innodb Handler_r

    攻略 2021年11月10日
  • oracle left join先后顺序(oracle rac)

    技术ORACLE 10G RAC如何启动与关闭小编给大家分享一下ORACLE 10G RAC如何启动与关闭,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了

    攻略 2021年12月18日
  • 负数的怎么用二进制表示(二进制表示负数有什么好处)

    技术负数的二进制表示方法是什么本篇内容介绍了“负数的二进制表示方法是什么”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!原

    攻略 2021年12月21日
  • Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么

    技术Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么这篇文章将为大家详细讲解有关Hadoop0.20.0部署与测试中的单机和伪分布模式操作方法是什么,文章内容质量较高,因此小编分享给大家做个参考,希望

    攻略 2021年11月23日
  • Python中map、filter和reduce的函数怎么用

    技术Python中map、filter和reduce的函数怎么用这篇文章主要介绍Python中map、filter和reduce的函数怎么用,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!  1、m

    攻略 2021年11月24日
  • DM-表空间

    技术DM-表空间 DM-表空间DM表空间表空间
    表空间由一个或者多个数据文件组成。
    在创建 DM 数据库时,会自动创建 5 个表空间:SYSTEM 表空间、ROLL 表空间、MAIN 表空间、TEMP

    礼包 2021年10月19日