Linux实例内存使用率过高

煎鱼 2021年4月1日10:41:01
评论
73,828 1980字阅读6分36秒

现象描述

Linux 云服务器实例出现由内存问题引发的故障。例如,系统内部服务响应速度变慢、服务器登录不上、系统触发 OOM(Out Of Memory)等。

可能原因

可能是实例内存使用率过高等问题引起。通常情况下当实例内存使用率持续高于90%时,可判断为实例内存使用率过高。

排查思路

1、参考 下方处理步骤,判断问题是否由内存使用率过高引起。

2、参考 其他内存问题典型案例分析,定位问题原因。

处理步骤

1、参考 相关操作,查看内存使用率是否过高。

  • 内存使用率过高,则执行下一步。
  • 内存使用率正常,则请参考 其他内存问题典型案例分析,进一步定位问题原因。

2、在系统内部执行 top 命令后按 M,查看 “RES” 及 “SHR” 列是否有进程占用内存过高。

  • 否,则执行下一步。
  • 是,则对应进程类型进行操作,详情请参见 分析进程。

3、执行以下命令,查看共享内存占用是否过高。

cat /proc/meminfo | grep -i shmem

返回结果如下图所示:

Linux实例内存使用率过高

4、执行如下命令,查看不可回收的 slab 内存占用是否过高。

cat /proc/meminfo | grep -i SUnreclaim

返回结果如下图所示:

Linux实例内存使用率过高

5、执行以下命令,查看是否存在内存大页。

cat /proc/meminfo | grep -iE "HugePages_Total|Hugepagesize"

返回结果如下图所示:
Linux实例内存使用率过高

  • HugePages_Total 输出为0,则请参考 其他内存问题典型案例分析,进一步定位问题原因。
  • HugePages_Total 输出非0,则表示配置了内存大页。内存大页的大小为HugePages_Total*Hugepagesize, 您需确认 hugepage 是否为其他恶意程序配置。若确认已不需要内存大页,可通过注释 /etc/sysctl.conf 文件中的 vm.nr_hugepage 配置项,再执行 sysctl -p 命令取消内存大页。

相关操作

查看内存使用率

由于不同 Linux 发行版的 free 命令输出的含义可能有区别,内存使用率不能通过简单的 free 命令输出信息进行计算得出。请按照以下步骤,通过腾讯云内存监控得到内存使用率:

1、登录 云服务器控制台,进入实例管理页面。

2、选择实例 ID,进入实例详情页面,并选择【监控】页签。

3、在“内存监控”中可查看该实例的内存利用率。如下图所示:

Linux实例内存使用率过高

计算内存使用率

内存监控中内存使用率计算方法为:用户使用的内存量与总内存量之比,不包括缓冲区与系统缓存占用的内容。计算过程如下:

= (Total - available)100% / Total

= (Total - (Free + Buffers + Cached + SReclaimable - Shmem))100% /Total

= (Total - Free - Buffers - Cached - SReclaimable + Shmem)* 100% / Total

计算过程中使用的 Total、Free、Buffer、Cached、SReclaimable、Shmem 参数可从 /proc/meminfo 中获取。/proc/meminfo 示例如下:

1. [root@VM_0_113_centos test]# cat /proc/meminfo 
2. MemTotal: 16265592 kB
3. MemFree: 1880084 kB
4. ......
5. Buffers: 194384 kB
6. Cached: 13647556 kB
7. ......
8. Shmem: 7727752 kB
9. Slab: 328864 kB
10. SReclaimable: 306500 kB
11. SUnreclaim: 22364 kB
12. ......
13. HugePages_Total: 0
14. Hugepagesize: 2048 kB

参数说明如下:

参数 说明
MemTotal 系统总内存。
MemFree 系统剩余内存。
Buffers 表示块设备(block device)所占用的缓存页,包括直接读写块设备,以及文件系统元数据(metadata),例如 SuperBlock 所使用的缓存页。
Cached page cache,包含 tmpfs 中的文件 POSIX/SysV shared memory 及 shared anonymous mmap
Shmem 包括共享内存,tmpfs 等。
Slab 内核 slab 分配器分配的内存,可以用 slabtop 查看。
SReclaimable 可回收的 slab。
SUnreclaim 不可回收的 slab。
HugePages_Total 内存大页总共的页数。
Hugepagesize 内存大页一页的大小。

其他内存问题典型案例分析

如通过以上步骤均无法处理问题,或您使用云服务器时出现以下类型的错误信息,则可以参考以下解决方案:

继续阅读
煎鱼
  • 本文由 发表于 2021年4月1日10:41:01
  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接
VNC 登录报错 Cannot allocate memory 脚本编程

VNC 登录报错 Cannot allocate memory

现象描述 使用 VNC 登录云服务器时,无法正常进入系统,且出现 “Cannot allocate memory” 报错信息。如下图所示: 可能原因 可能是系统中存在多个大页内存导致。一个大页内存默认...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: