性能分析与调优: Linux 内存观测工具

主机	架构	组件	IP	备注
prometheus	监测系统	prometheus、node_exporter	?192.168.204.18
grafana	监测GUI	grafana	192.168.204.19
agent?	监测主机	node_exporter	192.168.204.20

（2）内存观测工具

表1-2 内存观测工具

序号	工具	描述
1	vmstat	虚拟内存和物理内存统计信息
2	PSI	内存压力滞留信息
3	swapon	交换设备使用率
4	sar	历史统计信息
5	slabtop	内核slab分配器统计信息
6	numastat	NUMA分析
7	ps	进程状态
8	top	监测每个进程的内存使用率
9	pmap	进程地址空间统计信息
10	perf	内存PMC和跟踪点分析
11	bpftrace	用于内存分析的跟踪程序

2.vmstat?

(1) 每秒1次，共5次输出

[root@agent ~]# vmstat 1 5

（2）-S 选项将输出单位修改为MB（m表示1 000 000， M表示 1 048 576）

[root@agent ~]# vmstat -Sm 1 5

[root@agent ~]# vmstat -SM 1 5

(3) -a 选项可以输出非活动inactive和活动页active缓存的明细

[root@agent ~]# vmstat -a 1 5

3.PSI?

(1) 显示是否有内存压力，和过去5分钟内的变化情况

cat /proc/pressure/memory

some开头的一行显示了一些任务（线程）受到影响的时间，full开头的一行显示了所有可运行任务受到影响的时间

4.swapon

(1) 显示配置的交换设备以及使用率

[root@agent ~]# swapon

5.sar

(1) -B 换页统计信息

每秒1次，共5次

[root@agent ~]# sar -B 1 5

（2）-H 巨型页统计信息

?每秒1次，共5次

[root@agent ~]# sar -H 1 5

（3）-r 内存使用率

?每秒1次，共5次

[root@agent ~]# sar -r 1 5

（4）-S 交换空间统计信息

?每秒1次，共5次

[root@agent ~]# sar -S 1 5

（5）-W 交换统计信息

[root@agent ~]# sar -W 1 5

6.slabtop

(1) 输出内核slab缓存使用情况

每5s显示一次

[root@agent ~]# slabtop -d 5

7.numstat

（1）查询CPU插槽系数

为非统一内存访问（NUMA）系统提供统计数据

[root@agent ~]# numastat

8.ps

(1) 列出包括内存使用同统计信息在内的所有进程细节

[root@agent ~]# ps aux

（2）数据列用SVR4 方式的-o选择

[root@agent ~]# ps -eo pid,pmem,vsz,rss,comm

9.top

(1) 显示内存使用统计信息

[root@agent ~]# top -o %MEM

10.pmap

(1) 列出一个进程的内存映射，显示其大小、权限和映射对象

[root@agent ~]# pmap -x 755

（2）-X 显示更多的细节

[root@agent ~]# pmap -X $(pgrep mysqld) | head -2

（3）-XX 显示内核提供的“一切”

[root@agent ~]# pmap -XX $(pgrep mysqld) | head -2

11.perf

(1) 采样整个系统的缺页（RSS增长）机器栈踪迹，按下CTRL+C组合键结束

[root@agent ~]# perf record -e page-faults -a -g

（2）记录pid为755的进程在60秒内发生的所有却也及其栈踪迹

[root@agent ~]# perf record -e page-faults -c 1 -p 755 -g -- sleep 60

（3）通过brk记录栈的增长，按下CTRL+C组合键结束

[root@agent ~]# perf record -e syscalls:sys_enter_brk -a -g

（4）记录NUMA系统上的页迁移情况

[root@agent ~]# perf record -e migrate:mm_migrate_pages -a

（5）使用栈踪迹来跟踪kswapd唤醒时间，按下CTRL+C组合键结束

[root@agent ~]# perf record -e vmscan:mm_vmscan_wakeup_kswapd -ag

12.bpftrace

(1)按代码路径对进程堆扩张情况（brk）计数

[root@agent ~]# bpftrace -e 'tracepoint:syscalls:sys_enter_brk { @[ustack,comm] = count(); }'

（2）按跟踪点对vmscan操作数量计数

[root@agent ~]# bpftrace -e 'tracepoint:vmscan:*  { @[probe] = count(); }'

（3）按进程对swapins操作数量计数

[root@agent ~]# bpftrace -e 'kprobe:swap_readpage { @[comm,pid] = count(); }'

(4) 对页迁移数量计数?

[root@agent ~]# bpftrace -e 'tracepoint:migrate:mm_migrate_pages  { @  = count(); }'

（5）跟踪内存压缩事件

[root@agent ~]# bpftrace -e 't:compaction:mm_compaction_begin  { time(); }'

（6）列出内核kmem的跟踪点

[root@agent ~]# bpftrace -l 't:mm_*'

（7）列出所有内存子系统（mm）的跟踪点

[root@agent ~]# bpftrace -l 't:mm_*'

二、问题

1.接口读写报错

（1）报错

提示“不支持的操作”或?"Operation not supported"

（2）原因分析

查看当前内核版本

?5.4 版本的内核在 "psi_proc_init" 函数中没有进行 "psi_enable" 的判断，就直接创建了 "/proc" 下的这些文件，导致可以看到而不能使用。

（3）解决方法

此问题已在 5.6 版本里修复了，如下面的commit。

sched/psi: create /proc/pressure and /proc/pressure/{io|memory|cpu} o… · torvalds/linux@3d81768 · GitHub

2.slabtop如何安装

（1）安装

yum install procps-ng

（2）使用

slabtop -d 5              #每5s显示一次

（3）参数

选项	说明
-d n / --delay=n	设置显示的时间间隔
-s S / --sort=S	设置排序规则。a，以活动对象数目排序；b，以每个slab对象数目排序；c，以缓存大小排序；l，以slab数量排序；v，以多动的slab排序；n，以名字排序；o，以对象数目排序；p，以每slab的页数排序；u，以缓存利用率排序
-o /--once	只显示一次，之后退出
-V / --version	显示版本信息，并且退出
--help	显示帮助信息，并且退出

设置排序规则

[root@agent ~]# slabtop -s S

只显示一次，之后退出

显示版本信息

[root@agent ~]# slabtop -V

显示帮助信息

[root@agent ~]# slabtop --help

3.numactl如何安装

（1）安装

yum -y install numactl

(2) 使用

numactl -H      #查看当前服务器的NUMA配置。

（3）参数

--show:可以查看当前的numa策略，

-H：可以显示各Node中内存使用情况

--membind：只从某节点分配内存，当某节点内存不足，则会分配失败，格式：

numactl --membind=nodes program（nodes写你要分配的节点0或1或者其它节点数，后面是程序，可以写绝对路径，也可写服务启动脚本）

--numactl：把进程绑定到某节点上，用法如下：

numactl --cpunodebind=nodes program（nodes为Cpu节点，后面跟程序,）

--physcpubind:把进程绑定到某核心上，如果程序运行，用法如下(参数太长就简写了，其它简写参数自己Man)：

numactl -C 1,3 httpd

--localalloc:指令永远在当前节点分配内存，用法：

numactl -l httpd

--preferred：如果指定的内存无法分配足够的空间，可以指定去某一个节点的内存分配，格式如下：

numactl --preferred=0 http

4.numad启动服务与关闭NUMA

（1）numad

numad是一个自动numa亲和度管理进程。监控NUMA拓扑和资源使用，来动态提高NUMA资源分配和管理。

（2）启动命令

service numad start

（3）关闭NUMA

方法一：通过bios关闭

BIOS:interleave = Disable / Enable

方法二：通过OS关闭

①编辑 /etc/default/grub 文件，加上：numa=off

GRUB_CMDLINE_LINUX="crashkernel=auto numa=off rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet"

②重新生成 /etc/grub2.cfg 配置文件

grub2-mkconfig -o /etc/grub2.cfg

③ 重启操作系统

reboot

④ 确认

# dmesg | grep -i numa

# cat /proc/cmdline

5. perf如何安装

（1）查看当前可用的内核发行版本

yum --disablerepo="*" --enablerepo="elrepo-kernel" list available

（2）安装

yum --enablerepo=elrepo-kernel install perf

6. kernel-lt-doc与kernel-lt-tools-libs-devel如何安装

(1)查看当前可用的内核发行版本

yum --disablerepo="*" --enablerepo="elrepo-kernel" list available

(2) 安装依赖包

yum --enablerepo=elrepo-kernel install kernel-lt-doc \
kernel-lt-tools-libs-devel

7.bpftrace如何安装

（1）查询

rpm -qa | grep bcc-static
rpm -qa | grep bcc-tools
rpm -qa | grep bpftrace 
rpm -qa | grep bpftrace-tools
rpm -qa | grep  bpftrace-doc

（2）添加repo

curl https://repos.baslab.org/rhel/7/bpftools/bpftools.repo --output /etc/yum.repos.d/bpftools.repo

（2）安装

 yum install bpftrace bpftrace-tools bpftrace-doc bcc-static -y

8.?drsnoop如何使用

(1) 跟踪通过直接回收释放内存的方法，显示受影响的进程和延时

drsnoop -T

文章来源:https://blog.csdn.net/cronaldo91/article/details/135455054
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：chenni525@qq.com进行投诉反馈，一经查实，立即删除！