性能分析与调优: Linux 内存观测工具

发布时间:2024年01月08日

目录

一、实验

1.环境

2.vmstat?

3.PSI?

4.swapon

5.sar

6.slabtop

7.numstat

8.ps

9.top

10.pmap

11.perf

12.bpftrace

二、问题

1.接口读写报错

2.slabtop如何安装

3.numactl如何安装

4.numad启动服务与关闭NUMA

5. perf如何安装

6. kernel-lt-doc与kernel-lt-tools-libs-devel如何安装

7.bpftrace如何安装

8.?drsnoop如何使用


一、实验

1.环境

(1)主机

表1-1 主机

主机架构组件IP备注
prometheus

监测

系统

prometheus、node_exporter?192.168.204.18
grafana监测GUIgrafana192.168.204.19
agent?

监测

主机

node_exporter192.168.204.20

(2)内存观测工具

表1-2 内存观测工具

序号工具描述
1vmstat虚拟内存和物理内存统计信息
2PSI内存压力滞留信息
3swapon交换设备使用率
4sar历史统计信息
5slabtop内核slab分配器统计信息
6numastatNUMA分析
7ps进程状态
8top监测每个进程的内存使用率
9pmap进程地址空间统计信息
10perf内存PMC和跟踪点分析
11bpftrace用于内存分析的跟踪程序

2.vmstat?

(1) 每秒1次,共5次输出

[root@agent ~]# vmstat 1 5

(2)-S 选项将输出单位修改为MB(m表示1 000 000, M表示 1 048 576)

[root@agent ~]# vmstat -Sm 1 5

[root@agent ~]# vmstat -SM 1 5

(3) -a 选项可以输出非活动inactive和活动页active缓存的明细

[root@agent ~]# vmstat -a 1 5

3.PSI?

(1) 显示是否有内存压力,和过去5分钟内的变化情况

cat /proc/pressure/memory

some开头的一行显示了一些任务(线程)受到影响的时间,full开头的一行显示了所有可运行任务受到影响的时间

4.swapon

(1) 显示配置的交换设备以及使用率

[root@agent ~]# swapon

5.sar

(1) -B 换页统计信息

每秒1次,共5次

[root@agent ~]# sar -B 1 5

(2)-H 巨型页统计信息

?每秒1次,共5次

[root@agent ~]# sar -H 1 5

(3)-r 内存使用率

?每秒1次,共5次

[root@agent ~]# sar -r 1 5

(4)-S 交换空间统计信息

?每秒1次,共5次

[root@agent ~]# sar -S 1 5

(5)-W 交换统计信息

[root@agent ~]# sar -W 1 5

6.slabtop

(1) 输出内核slab缓存使用情况

每5s显示一次

[root@agent ~]# slabtop -d 5

7.numstat

(1)查询CPU插槽系数

为非统一内存访问(NUMA)系统提供统计数据

[root@agent ~]# numastat

8.ps

(1) 列出包括内存使用同统计信息在内的所有进程细节

[root@agent ~]# ps aux

(2)数据列用SVR4 方式的-o选择

[root@agent ~]# ps -eo pid,pmem,vsz,rss,comm

9.top

(1) 显示内存使用统计信息

[root@agent ~]# top -o %MEM

10.pmap

(1) 列出一个进程的内存映射,显示其大小、权限和映射对象

[root@agent ~]# pmap -x 755

(2)-X 显示更多的细节

[root@agent ~]# pmap -X $(pgrep mysqld) | head -2

(3)-XX 显示内核提供的“一切”

[root@agent ~]# pmap -XX $(pgrep mysqld) | head -2

11.perf

(1) 采样整个系统的缺页(RSS增长)机器栈踪迹,按下CTRL+C组合键结束

[root@agent ~]# perf record -e page-faults -a -g 

(2)记录pid为755的进程在60秒内发生的所有却也及其栈踪迹

[root@agent ~]# perf record -e page-faults -c 1 -p 755 -g -- sleep 60

(3)通过brk记录栈的增长,按下CTRL+C组合键结束

[root@agent ~]# perf record -e syscalls:sys_enter_brk -a -g

(4)记录NUMA系统上的页迁移情况

[root@agent ~]# perf record -e migrate:mm_migrate_pages -a

(5)使用栈踪迹来跟踪kswapd唤醒时间,按下CTRL+C组合键结束

[root@agent ~]# perf record -e vmscan:mm_vmscan_wakeup_kswapd -ag

12.bpftrace

(1)按代码路径对进程堆扩张情况(brk)计数

[root@agent ~]# bpftrace -e 'tracepoint:syscalls:sys_enter_brk { @[ustack,comm] = count(); }'

(2)按跟踪点对vmscan操作数量计数

[root@agent ~]# bpftrace -e 'tracepoint:vmscan:*  { @[probe] = count(); }'

(3)按进程对swapins操作数量计数

[root@agent ~]# bpftrace -e 'kprobe:swap_readpage { @[comm,pid] = count(); }'

(4) 对页迁移数量计数?

[root@agent ~]# bpftrace -e 'tracepoint:migrate:mm_migrate_pages  { @  = count(); }'

(5)跟踪内存压缩事件

[root@agent ~]# bpftrace -e 't:compaction:mm_compaction_begin  { time(); }'

(6)列出内核kmem的跟踪点

[root@agent ~]# bpftrace -l 't:mm_*'

(7)列出所有内存子系统(mm)的跟踪点

[root@agent ~]# bpftrace -l 't:mm_*'

二、问题

1.接口读写报错

(1)报错

提示“不支持的操作”或?"Operation not supported"

(2)原因分析

查看当前内核版本

?5.4 版本的内核在 "psi_proc_init" 函数中没有进行 "psi_enable" 的判断,就直接创建了 "/proc" 下的这些文件,导致可以看到而不能使用。

(3)解决方法

此问题已在 5.6 版本里修复了,如下面的commit。

sched/psi: create /proc/pressure and /proc/pressure/{io|memory|cpu} o… · torvalds/linux@3d81768 · GitHub

2.slabtop如何安装

(1)安装

yum install procps-ng

(2)使用

slabtop -d 5              #每5s显示一次

(3)参数

选项说明
-d n / --delay=n设置显示的时间间隔
-s S / --sort=S设置排序规则。a,以活动对象数目排序;b,以每个slab对象数目排序;c,以缓存大小排序;l,以slab数量排序;v,以多动的slab排序;n,以名字排序;o,以对象数目排序;p,以每slab的页数排序;u,以缓存利用率排序
-o /--once只显示一次,之后退出
-V / --version显示版本信息,并且退出
--help显示帮助信息,并且退出

设置排序规则

[root@agent ~]# slabtop -s S

只显示一次,之后退出

显示版本信息

[root@agent ~]# slabtop -V

显示帮助信息

[root@agent ~]# slabtop --help

3.numactl如何安装

(1)安装

yum -y install numactl

(2) 使用

numactl -H      #查看当前服务器的NUMA配置。

(3)参数

--show:可以查看当前的numa策略,

-H:可以显示各Node中内存使用情况

--membind:只从某节点分配内存,当某节点内存不足,则会分配失败,格式:

numactl --membind=nodes program(nodes写你要分配的节点0或1或者其它节点数,后面是程序,可以写绝对路径,也可写服务启动脚本)

--numactl:把进程绑定到某节点上,用法如下:

numactl --cpunodebind=nodes program(nodes为Cpu节点,后面跟程序,)

--physcpubind:把进程绑定到某核心上,如果程序运行,用法如下(参数太长就简写了,其它简写参数自己Man):

numactl -C 1,3 httpd

--localalloc:指令永远在当前节点分配内存,用法:

numactl -l httpd

--preferred:如果指定的内存无法分配足够的空间,可以指定去某一个节点的内存分配,格式如下:

numactl --preferred=0 http

4.numad启动服务与关闭NUMA

(1)numad

numad是一个自动numa亲和度管理进程。监控NUMA拓扑和资源使用,来动态提高NUMA资源分配和管理。


(2)启动命令

service numad start

(3)关闭NUMA

方法一:通过bios关闭

BIOS:interleave = Disable / Enable

方法二:通过OS关闭

①编辑 /etc/default/grub 文件,加上:numa=off

GRUB_CMDLINE_LINUX="crashkernel=auto numa=off rd.lvm.lv=centos/root rd.lvm.lv=centos/swap rhgb quiet"

②重新生成 /etc/grub2.cfg 配置文件

grub2-mkconfig -o /etc/grub2.cfg

③ 重启操作系统

reboot

④ 确认

# dmesg | grep -i numa

# cat /proc/cmdline

5. perf如何安装

(1)查看当前可用的内核发行版本

yum --disablerepo="*" --enablerepo="elrepo-kernel" list available

(2)安装

yum --enablerepo=elrepo-kernel install perf

6. kernel-lt-doc与kernel-lt-tools-libs-devel如何安装

(1)查看当前可用的内核发行版本

yum --disablerepo="*" --enablerepo="elrepo-kernel" list available

(2) 安装依赖包

yum --enablerepo=elrepo-kernel install kernel-lt-doc \
kernel-lt-tools-libs-devel

7.bpftrace如何安装

(1)查询

rpm -qa | grep bcc-static
rpm -qa | grep bcc-tools
rpm -qa | grep bpftrace 
rpm -qa | grep bpftrace-tools
rpm -qa | grep  bpftrace-doc

(2)添加repo

curl https://repos.baslab.org/rhel/7/bpftools/bpftools.repo --output /etc/yum.repos.d/bpftools.repo 

(2)安装

 yum install bpftrace bpftrace-tools bpftrace-doc bcc-static -y

8.?drsnoop如何使用

(1) 跟踪通过直接回收释放内存的方法,显示受影响的进程和延时

drsnoop -T

文章来源:https://blog.csdn.net/cronaldo91/article/details/135455054
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。