临近年关收尾,服务器巡检是实施人员的重点工作之一,直接关系到业务稳定性与跨年运维安全。今天分享我近期巡检中高频使用的Linux系统层面检查命令,聚焦CPU、磁盘、内存三大核心维度,实操性拉满。一、系统层面CUP使用情况检查
1、top(实时监控)
直接输入top,默认按 CPU 占用率排序,重点关注:
%Cpu(s):整体 CPU 使用率(us:用户态,sy:内核态,id:空闲)
PID:进程 ID
%CPU:单个进程的 CPU 占用率操作快捷键:
P:按 CPU 使用率排序
k:终止指定 PID 的进程
q:退出 top
2、ps(静态查看进程 CPU 占用)
与top实时监控不同,ps命令用于静态抓取某一时刻的进程状态,适合留存巡检记录。推荐组合命令:ps -aux | grep 进程名 或 ps -ef | sort -k 3 -r(按CPU占用率倒序排列),可快速筛选目标进程的CPU占用、运行用户、启动参数等信息,补充top命令的静态核查需求。二、服务器本地磁盘空间检查
磁盘空间不足是年底巡检高频问题,易导致业务卡顿、日志写入失败,需重点排查。核心命令df -h-h:以人类可读的单位(GB/MB)显示结果,核心关注列:
Mounted on:磁盘挂载目录(需重点关注 Oracle 安装目录、数据文件目录、归档日志目录)
Use%:磁盘使用率,超过 85% 需及时清理
三、操作系统使用内存
内存资源紧张会影响服务器响应速度,尤其对数据库、核心业务服务影响显著。核心命令free -h-h:表示以GB/MB等人类易读的单位展示数据,而非原始字节数。
total:总容量(物理内存 / 交换分区的总大小)
used:已使用容量(包含进程占用 + 系统缓存)
free:完全空闲容量(未被任何进程或缓存使用)
shared:多进程共享的内存容量(一般占用较小)
buff/cache:系统磁盘缓存 + 缓冲区的容量(可回收,用于提升读写性能)
available:实际可用容量(推荐重点关注)= 空闲内存 + 可回收缓存,代表能分配给新进程的内存
今天记两个,咱明天继续。