主机操作系统SUN OS M5000.
主要问题为SWAP溢出,从AWR报告中显示,一场阶段数据库总消耗内存13%左右,并没有什么异常,很诧异,因为之前由于业务在/tmp目录创建dmp文件导致swap占用100%,导致数据库进程无法衍生,
而未在/tmp目录中创建大文件且数据库连接数据合计也就在300?左右,很诧异,数据库内存都去哪了???导致大量的swap被占用?????
由于这个SUN OS和另外一台T4-4互为VCS主备,之前做过切换演练,会不会是因为另外一个高内存数据库异常切换走,但是共享内存shm未释放导致大量的内存占用???
ipcs -ma
-bash-3.00$ ipcs -ma
IPC status from <running system> as of Thu Dec 21 15:59:17 CST 2023
T ? ? ? ? ID ? ? ?KEY ? ? ? ?MODE ? ? ? ?OWNER ? ?GROUP ?CREATOR ? CGROUP NATTCH ? ? ?SEGSZ ?CPID ?LPID ? ATIME ? ?DTIME ? ?CTIME?
Shared Memory:
m ? ? ? ? 72 ? 0x37a5e878 --rw-r----- ? orcl2 oinstall ? orcl2 oinstall ? ?329 ? ? ?16384 12437 11979 15:59:13 15:59:13 ?7:56:41
m ? ? ? ? 71 ? 0 ? ? ? ? ?--rw-r----- ? orcl2 oinstall ? orcl2 oinstall ? ?329 37312528384 12437 11979 15:59:13 15:59:13 ?7:55:56
m ? ? ? ? 70 ? 0 ? ? ? ? ?--rw-r----- ? orcl2 oinstall ? orcl2 oinstall ? ?329 ?268435456 12437 11979 15:59:13 15:59:13 ?7:55:56
m ? ? ? ? 59 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 6442450944 13766 13766 ?3:07:16 ?3:07:16 ?3:05:07
m ? ? ? ? 58 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 12884901888 13766 13766 ?3:05:07 ?3:07:16 ?3:02:47
m ? ? ? ? 57 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 1073741824 13766 13766 ?3:02:47 ?3:07:16 ?3:02:06
m ? ? ? ? 56 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 51002736640 ?4038 ?4038 ?1:17:12 ?1:17:12 ?1:02:10
m ? ? ? ? 55 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 101468602368 ?4038 ?4038 ?1:02:10 ?1:17:12 ?0:59:32 101G
m ? ? ? ? 54 ? 0 ? ? ? ? ?--rw-r----- ? orcl1 oinstall ? orcl1 oinstall ? ? ?0 1073741824 ?4038 ?4038 ?0:59:32 ?1:17:12 ?0:59:30 1G
m ? ? ? ? ?6 ? 0x5654 ? ? --rw-rw-rw- ? ? root ? ? root ? ? root ? ? root ? ? ?1 ? ? ? 1024 ?3369 ?4048 ?9:57:34 14:45:18 ?9:57:34
m ? ? ? ? ?5 ? 0x5643 ? ? --rw-rw-rw- ? ? root ? ? root ? ? root ? ? root ? ? ?1 ? ? ? 1024 ?3369 ?4048 ?9:57:34 14:45:18 ?9:57:34
m ? ? ? ? ?4 ? 0x53494152 --rw-r--r-- ? ? root ? ? root ? ? root ? ? root ? ? ?1 ? ? ? 1024 ?3363 ?3388 ?9:57:34 ?9:57:40 ?9:57:34
m ? ? ? ? ?3 ? 0x44525354 --rw-r--r-- ? ? root ? ? root ? ? root ? ? root ? ? ?3 ? ? 649216 ?3363 ?4048 14:45:19 14:45:21 ?9:57:34
m ? ? ? ? ?2 ? 0x55315352 --rw-rw-rw- ? ? root ? ? root ? ? root ? ? root ? ? ?1 ? ? ? 4096 ?3363 ?5624 ?2:42:35 ?2:42:35 ?9:57:34
m ? ? ? ? ?1 ? 0x4d4e5251 --rw-r--r-- ? ? root ? ? root ? ? root ? ? root ? ? ?2 ? ? 330752 ?3363 ?4048 14:45:19 14:45:21 ?9:57:34
m ? ? ? ? ?0 ? 0x5500ab8b --rw-r--r-- ? ? root ? ? root ? ? root ? ? root ? ? ?1 ? ? 256064 ? ?61 ?5588 ?9:53:33 ?0:40:59 ?9:53:33
-bash-3.00$?
问题已经很清楚了,orcl1数据库在此SGA配置将近160多个G,一致在占用shm。呆滞主机内存耗尽。
ipcrm -m 54
ipcrm -m 55
ipcrm -m 56
ipcrm -m 57
ipcrm -m 58
ipcrm -m 59
ipcs -ma衍生问题:那么就需要调整orcl1实例在这台主机的内存量,避免在切换过来导致内存溢出问题。
?