思路:从“系统是否还活着” → “资源” → “进程” → “网络” → “应用”
1️⃣ uptime
先确认:系统是不是已经在“喘气”
👉 很多事故,一句 uptime 就已经定性 50%
2️⃣ top / htop
实时体检仪
3️⃣ free
内存到底够不够?
4️⃣ vmstat
CPU / 内存 / IO 一眼看穿
5️⃣ iostat
磁盘是不是瓶颈?
6️⃣ ps
谁在吃资源?
ps aux --sort=-%cpu | headps aux --sort=-%mem | head
7️⃣ lsof
端口、文件、句柄泄漏终结者
lsof -i :8080lsof | wc -l
8️⃣ ss / netstat
网络连接是否异常?
9️⃣ tcpdump
当应用说不清,就抓包
🔟 dmesg
内核在“悄悄尖叫”
排障顺序口诀
负载 → CPU → 内存 → IO → 进程 → 网络 → 内核
90% 的 Linux 故障,都能在这个顺序里解决。一句话总结
排障不是“命令多”,而是“顺序对 + 观察对”。
如果这篇文章对你有帮助
欢迎 👍点赞 / 💗推荐 / ↗️转发给需要的朋友
关注「技术杂家」学习更多的技术知识
文章推荐
SSH 常用命令行参数详解:从能连上到玩出花
Linux网络诊断-自顶向下逐层排障的工程方法论和工具
tmux入门+高级技巧合集:Vibe Coding时代的终端基石