半夜收到告警短信——CPU使用率90%+,打开终端脑子一片空白。到底哪个进程搞的鬼?业务高峰还是被攻击了?系统问题还是代码bug?
其实CPU排查是有套路可循的。从快速定位到深入分析,从应急处理到预防监控,每一步该用什么命令、看什么指标,都有成熟的流程。
CPU高排查这件事,说到底就三个关键词:定进程、分场景、找根因。
别一上来就kill -9,那是最后的手段。先用top看整体、用vmstat看分布、用ps定位进程,再用对应的工具深入分析——Java用jstack、MySQL看慢查询、系统层用perf。一套流程走下来,大部分问题都能找到根源。