当前位置：首页>Linux>Linux故障排查瑞士军刀-工程师实战版

Linux故障排查瑞士军刀-工程师实战版

2026-02-06 08:02:48

思路：从“系统是否还活着” → “资源” → “进程” → “网络” → “应用”

1️⃣ uptime

先确认：系统是不是已经在“喘气”

uptime

看什么：

load average 是否暴涨
是否长期 load > CPU 核数

👉 很多事故，一句 uptime 就已经定性 50%

2️⃣ top / htop

实时体检仪

tophtop

重点看：

CPU 是否 100%
%wa（IO wait）
内存是否被吃光
是否有异常进程

3️⃣ free

内存到底够不够？

free -h

关注：

available 而不是 free
swap 是否疯狂增长

👉 OOM 前的必看命令

4️⃣ vmstat

CPU / 内存 / IO 一眼看穿

vmstat 1

关键指标：

r：运行队列
wa：IO 等待
si/so：swap 进出

👉 排查“卡但不崩”的神器

5️⃣ iostat

磁盘是不是瓶颈？

iostat -x 1

重点看：

%util 接近 100%
await 是否异常高

6️⃣ ps

谁在吃资源？

ps aux --sort=-%cpu | headps aux --sort=-%mem | head

用途：

精确锁定元凶进程
判断是否进程泄漏

7️⃣ lsof

端口、文件、句柄泄漏终结者

lsof -i :8080lsof | wc -l

常见问题：

端口被占
fd 泄漏导致服务异常

8️⃣ ss / netstat

网络连接是否异常？

ss -antss -s

关注：

TIME_WAIT / CLOSE_WAIT
ESTABLISHED 数量异常

9️⃣ tcpdump

当应用说不清，就抓包

tcpdump -i eth0 port 443

排查：

丢包
重传
超时
三次握手异常

👉 高级工程师分水岭工具

🔟 dmesg

内核在“悄悄尖叫”

dmesg | tail

重点信息：

OOM killer
磁盘 / 网卡错误
内核异常

排障顺序口诀

负载 → CPU → 内存 → IO → 进程 → 网络 → 内核

90% 的 Linux 故障，都能在这个顺序里解决。

一句话总结

排障不是“命令多”，而是“顺序对 + 观察对”。

如果这篇文章对你有帮助

欢迎 👍点赞 / 💗推荐 / ↗️转发给需要的朋友

关注「技术杂家」学习更多的技术知识

文章推荐

SSH 常用命令行参数详解：从能连上到玩出花

Linux网络诊断-自顶向下逐层排障的工程方法论和工具

tmux入门+高级技巧合集：Vibe Coding时代的终端基石

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

Linux故障排查瑞士军刀-工程师实战版

1️⃣ uptime

2️⃣ top / htop

3️⃣ free

4️⃣ vmstat

5️⃣ iostat

6️⃣ ps

7️⃣ lsof

8️⃣ ss / netstat

9️⃣ tcpdump

🔟 dmesg

排障顺序口诀

一句话总结

文章推荐

最新文章

热门文章

随机文章

Linux故障排查瑞士军刀-工程师实战版

1️⃣ uptime

2️⃣ top / htop

3️⃣ free

4️⃣ vmstat

5️⃣ iostat

6️⃣ ps

7️⃣ lsof

8️⃣ ss / netstat

9️⃣ tcpdump

🔟 dmesg

排障顺序口诀

一句话总结

文章推荐

数字时代,成人为何要学编程:一场关乎未来的必修课

AI能写代码、自动部署,新手程序员却陷困境:没学底层,再趁手的工具也是废柴|知途拆书

最新文章

热门文章

随机文章