关注「Raymond运维」公众号,并设为「星标」,也可以扫描底部二维码加入群聊,第一时间获取最新内容,不再错过精彩内容。
Linux 磁盘管理与 I/O 性能优化:从扩容到调优的实战指南
适用场景 & 前置条件
适用场景:生产环境磁盘空间不足、I/O 性能瓶颈、数据库/存储服务器、容器化平台持久化存储。
前置条件:
- • OS:RHEL/CentOS 7.x-9.x、Ubuntu 18.04-24.04
- • 工具:parted、lvm2、xfsprogs/e2fsprogs、fio、iostat(sysstat 包)
环境与版本矩阵
快速清单(Checklist)
- 2. 识别磁盘类型(机械/SSD/NVMe)与 I/O 调度器
- 6. 执行 fio 基准测试验证 IOPS/吞吐量
实施步骤
Step 1:诊断磁盘空间与分区布局
查看分区与挂载点:
# 查看磁盘分区(机械盘 sd*,NVMe nvme*)
lsblk -f
fdisk -l | grep "Disk /dev"
# 查看文件系统使用率(含 inode)
df -hT
df -i
# 查看目录占用(找出大目录)
du -sh /* | sort -hr | head -10
du -h --max-depth=2 /var | sort -hr | head -20
预期输出:
NAME FSTYPE SIZE MOUNTPOINT
sda 100G
├─sda1 xfs 1G /boot
└─sda2 LVM2 99G
├─vg0-root xfs 50G /
└─vg0-var xfs 49G /var
关键参数:
- •
FSTYPE:确认文件系统类型(XFS 扩容用 xfs_growfs,ext4 用 resize2fs) - •
SIZE vs MOUNTPOINT:发现未分配空间或未挂载分区 - •
df -i:inode 使用率 >85% 需清理小文件
幂等性:只读命令,可重复执行。
Step 2:识别磁盘类型与 I/O 调度器
检测磁盘类型:
# 查看磁盘是否为 SSD/NVMe(rotational=0 表示 SSD)
lsblk -d -o NAME,ROTA,DISC-GRAN
cat /sys/block/sda/queue/rotational # 0=SSD, 1=HDD
# 查看当前 I/O 调度器
cat /sys/block/sda/queue/scheduler
# [mq-deadline] none (方括号内为当前值)
预期结果:
- • 机械盘(ROTA=1):推荐
deadline 或 cfq - • SSD/NVMe(ROTA=0):推荐
none(noop)或 mq-deadline
设置 I/O 调度器:
# 临时设置(重启失效)
echo none > /sys/block/nvme0n1/queue/scheduler
# 永久设置(RHEL/CentOS 使用 udev 规则)
cat > /etc/udev/rules.d/60-ioscheduler.rules <<'EOF'
# SSD/NVMe 使用 none
ACTION=="add|change", KERNEL=="nvme[0-9]n[0-9]", ATTR{queue/rotational}=="0", ATTR{queue/scheduler}="none"
ACTION=="add|change", KERNEL=="sd[a-z]", ATTR{queue/rotational}=="0", ATTR{queue/scheduler}="none"
# HDD 使用 mq-deadline
ACTION=="add|change", KERNEL=="sd[a-z]", ATTR{queue/rotational}=="1", ATTR{queue/scheduler}="mq-deadline"
EOF
# 重载 udev 规则
udevadm control --reload-rules && udevadm trigger
验证:
cat /sys/block/nvme0n1/queue/scheduler
# 应显示 [none]
Step 3:LVM 磁盘扩容(在线无停机)
场景:新增 /dev/sdb 100GB 磁盘,扩容 /var 分区。
创建物理卷(PV):
# 查看现有 PV
pvdisplay
# 将新磁盘加入 LVM
pvcreate /dev/sdb
pvdisplay /dev/sdb # 确认 PV Size
扩展卷组(VG):
# 查看现有 VG
vgdisplay
# 扩展 vg0 卷组
vgextend vg0 /dev/sdb
vgdisplay vg0 # 确认 Free PE 增加
扩展逻辑卷(LV):
# 查看 LV 路径
lvdisplay /dev/vg0/var
# 扩容 50GB(或使用 -l +100%FREE 扩容全部)
lvextend -L +50G /dev/vg0/var
# 或扩容全部可用空间:
# lvextend -l +100%FREE /dev/vg0/var
扩展文件系统:
# XFS 文件系统(在线扩容)
xfs_growfs /var
df -h /var # 验证空间增加
# ext4 文件系统
resize2fs /dev/vg0/var
df -h /var
执行前后验证:
# 执行前
df -h /var
# /dev/mapper/vg0-var 49G 45G 4G 92% /var
# 执行后
df -h /var
# /dev/mapper/vg0-var 99G 45G 54G 46% /var
回滚要点:LVM 扩容为单向操作,需提前快照:
# 创建快照(扩容前)
lvcreate -L 10G -s -n var-snapshot /dev/vg0/var
# 回滚(如文件系统损坏)
lvconvert --merge /dev/vg0/var-snapshot
Step 4:分区扩容(非 LVM 场景)
场景:云主机扩容系统盘,/dev/sda3 分区需扩展。
在线扩容分区(使用 growpart):
# 安装工具
# RHEL/CentOS
yum install -y cloud-utils-growpart
# Ubuntu
apt install -y cloud-guest-utils
# 扩容分区 3(不会删除数据)
growpart /dev/sda 3
partprobe /dev/sda # 重新读取分区表
# 扩展文件系统
# XFS
xfs_growfs /
# ext4
resize2fs /dev/sda3
手动扩容(使用 parted):
# 进入 parted(危险操作,需备份)
parted /dev/sda
(parted) print free # 查看可用空间
(parted) resizepart 3 100% # 扩容分区 3 到磁盘末尾
(parted) quit
# 通知内核重新读取分区表
partprobe /dev/sda
# 扩展文件系统
xfs_growfs / 或 resize2fs /dev/sda3
验证:
lsblk
df -h /
Step 5:I/O 性能基准测试与调优
安装 fio 工具:
# RHEL/CentOS
yum install -y fio
# Ubuntu
apt install -y fio
顺序读写测试:
# 顺序写测试(4MB 块,100GB 文件)
fio --name=seqwrite --rw=write --bs=4M --size=10G \
--numjobs=1 --runtime=60 --time_based \
--directory=/var/fio-test --ioengine=libaio --iodepth=16 \
--direct=1 --group_reporting
# 顺序读测试
fio --name=seqread --rw=read --bs=4M --size=10G \
--numjobs=1 --runtime=60 --time_based \
--directory=/var/fio-test --ioengine=libaio --iodepth=16 \
--direct=1 --group_reporting
随机读写测试(数据库场景):
# 随机写 IOPS 测试(4KB 块)
fio --name=randwrite --rw=randwrite --bs=4K --size=10G \
--numjobs=4 --runtime=60 --time_based \
--directory=/var/fio-test --ioengine=libaio --iodepth=32 \
--direct=1 --group_reporting
# 随机读 IOPS 测试
fio --name=randread --rw=randread --bs=4K --size=10G \
--numjobs=4 --runtime=60 --time_based \
--directory=/var/fio-test --ioengine=libaio --iodepth=32 \
--direct=1 --group_reporting
目标指标:
- • 机械盘:顺序读写 100-200 MB/s,随机 IOPS 100-300
- • SATA SSD:顺序读写 500-550 MB/s,随机 IOPS 50K-90K
- • NVMe SSD:顺序读写 2-7 GB/s,随机 IOPS 200K-1M
清理测试文件:
rm -rf /var/fio-test
Step 6:内核参数调优
优化虚拟内存与 I/O 参数:
# 编辑 sysctl 配置
cat >> /etc/sysctl.conf <<'EOF'
# 减少 swap 使用(数据库服务器推荐 10)
vm.swappiness = 10
# 脏页缓存比例(SSD 可提高到 15-20)
vm.dirty_ratio = 15
vm.dirty_background_ratio = 5
# 脏页刷盘时间(减少 I/O 延迟)
vm.dirty_expire_centisecs = 500
vm.dirty_writeback_centisecs = 100
# 文件句柄数(高并发场景)
fs.file-max = 2097152
EOF
# 应用配置
sysctl -p
验证:
sysctl vm.swappiness vm.dirty_ratio vm.dirty_background_ratio
调整文件系统挂载参数(XFS 优化):
# 编辑 /etc/fstab,添加 noatime 和 nodiratime(减少元数据写入)
# 原配置:
# /dev/mapper/vg0-var /var xfs defaults 0 0
# 优化后:
/dev/mapper/vg0-var /var xfs defaults,noatime,nodiratime 0 0
# 重新挂载(不停机)
mount -o remount /var
# 验证挂载参数
mount | grep /var
# 应包含 noatime,nodiratime
Step 7:磁盘清理与容量管理
清理日志与临时文件:
# 清理 systemd journal 日志(保留最近 7 天)
journalctl --vacuum-time=7d
journalctl --vacuum-size=1G
# 清理旧内核(RHEL/CentOS)
yum install -y yum-utils
package-cleanup --oldkernels --count=2
# 清理 apt 缓存(Ubuntu)
apt clean
apt autoclean
apt autoremove --purge
# 清理 Docker 资源(如适用)
docker system prune -af --volumes
查找大文件:
# 查找 > 1GB 的文件
find /var -type f -size +1G -execls -lh {} \; | sort -k5 -hr
# 查找最近 7 天未访问的大文件
find /var/log -type f -size +100M -atime +7
设置磁盘配额(针对用户/目录):
# XFS 配额(启用用户配额)
# 编辑 /etc/fstab,添加 uquota,gquota
/dev/mapper/vg0-var /var xfs defaults,uquota,gquota 0 0
# 重新挂载
mount -o remount /var
# 设置用户配额(限制 appuser 最多 50GB)
xfs_quota -x -c 'limit bsoft=45G bhard=50G appuser' /var
xfs_quota -x -c 'report -h' /var # 查看配额
监控与告警
Prometheus 监控指标
安装 node_exporter:
# 下载并启动 node_exporter
wget https://github.com/prometheus/node_exporter/releases/download/v1.8.2/node_exporter-1.8.2.linux-amd64.tar.gz
tar xf node_exporter-*.tar.gz
cd node_exporter-*/
./node_exporter &
关键 PromQL 查询:
# 磁盘使用率(告警阈值 85%)
(1 - node_filesystem_avail_bytes{mountpoint=~"/|/var"} / node_filesystem_size_bytes{mountpoint=~"/|/var"}) * 100 > 85
# inode 使用率(告警阈值 90%)
(1 - node_filesystem_files_free{mountpoint=~"/|/var"} / node_filesystem_files{mountpoint=~"/|/var"}) * 100 > 90
# 磁盘 I/O 使用率(告警阈值 80%)
rate(node_disk_io_time_seconds_total[5m]) * 100 > 80
# 磁盘读写延迟(P99 > 100ms 告警)
histogram_quantile(0.99, rate(node_disk_read_time_seconds_total[5m])) > 0.1
Grafana 面板推荐:
- • Dashboard ID 1860(Node Exporter Full)
- • 重点关注:Disk Space Used、Disk I/O、Disk Latency、IOPS
原生监控命令
实时 I/O 监控:
# iostat 查看磁盘 I/O(每 2 秒刷新)
iostat -xm 2
# iotop 查看进程 I/O(需 root 权限)
iotop -o # 只显示有 I/O 的进程
# 查看 I/O 等待(wa% > 20% 表示 I/O 瓶颈)
top
# 关注 %wa(I/O wait)列
阈值建议:
- • I/O wait > 20%:检查 I/O 调度器与应用优化
- • 磁盘队列深度(avgqu-sz)> 10:I/O 饱和
性能与容量
性能调优参数汇总
设置 readahead:
# 查看当前值
blockdev --getra /dev/sda
# 设置为 512 扇区(256KB)
blockdev --setra 512 /dev/sda
# 永久设置(添加到 /etc/rc.local)
echo'blockdev --setra 512 /dev/sda' >> /etc/rc.local
chmod +x /etc/rc.local
容量规划
预留空间策略:
- • 数据库盘:预留 20% 空间(用于临时排序、备份)
扩容触发条件:
- • IOPS 持续饱和(>80% utilization):升级磁盘规格
安全与合规
权限控制:
# 敏感目录设置严格权限
chmod 700 /var/lib/mysql
chown -R mysql:mysql /var/lib/mysql
# 禁止普通用户访问
chmod 750 /var/log
chown root:adm /var/log
审计日志:
# 启用 auditd 监控磁盘操作
auditctl -w /var/lib/mysql -p wa -k mysql_data_change
auditctl -w /etc/fstab -p wa -k fstab_change
# 查看审计日志
ausearch -k mysql_data_change
数据加密:
# LUKS 加密卷创建(新磁盘)
cryptsetup luksFormat /dev/sdb
cryptsetup luksOpen /dev/sdb encrypted_disk
mkfs.xfs /dev/mapper/encrypted_disk
备份策略:
常见故障与排错
| | | | |
|---|
| du -sh /* | sort -hr | | journalctl --vacuum-size=1G | |
| df -i / find / -xdev -printf '%h\n' | sort | uniq -c | sort -k 1 -n | | | |
| iostat -x 1 | | | |
| xfs_info /mount | | xfs_repair -n /dev/vg0/var | |
| lvs -a | | lvextend -L +5G /dev/vg0/snap | |
| dmesg | grep -i error | | mount -o remount,rw / | |
详细排错示例:磁盘满紧急处理:
# 1. 快速定位大目录
du -sh /* | sort -hr | head -5
# 2. 清理日志
journalctl --vacuum-time=1d
find /var/log -name "*.log" -mtime +7 -delete
# 3. 清理 Docker(如适用)
docker system prune -af
# 4. 临时扩容(如有未分配空间)
lvextend -L +10G /dev/vg0/var && xfs_growfs /var
# 5. 验证
df -h /var
变更与回滚剧本
变更前检查清单
# 1. 备份关键数据
tar czf /backup/var-$(date +%F).tar.gz /var/important-data
# 2. 创建 LVM 快照(如适用)
lvcreate -L 10G -s -n var-snapshot-$(date +%F) /dev/vg0/var
# 3. 记录当前状态
df -h > /root/df-before.txt
lsblk > /root/lsblk-before.txt
pvs && vgs && lvs > /root/lvm-before.txt
# 4. 检查磁盘健康(SMART)
smartctl -H /dev/sda
smartctl -A /dev/sda | grep -i "reallocated\|pending\|uncorrectable"
扩容执行剧本
#!/bin/bash
set -e # 遇错退出
# 变量定义
NEW_DISK="/dev/sdb"
VG_NAME="vg0"
LV_NAME="var"
EXTEND_SIZE="+50G"
# 步骤 1:创建 PV
pvcreate $NEW_DISK
# 步骤 2:扩展 VG
vgextend $VG_NAME$NEW_DISK
# 步骤 3:扩展 LV
lvextend -L $EXTEND_SIZE /dev/$VG_NAME/$LV_NAME
# 步骤 4:扩展文件系统
if mount | grep -q "type xfs"; then
xfs_growfs /var
else
resize2fs /dev/$VG_NAME/$LV_NAME
fi
# 步骤 5:验证
df -h /var
echo"扩容完成,当前 /var 使用情况如上"
回滚方案
场景 1:文件系统扩容失败:
# 如已创建快照,回滚到快照
umount /var
lvconvert --merge /dev/vg0/var-snapshot
mount /var
场景 2:误删除 PV:
# 恢复 LVM 元数据(如有备份)
vgcfgrestore -l vg0 # 查看备份
vgcfgrestore -f /etc/lvm/archive/vg0_XXXXX.vg vg0
vgchange -ay vg0
场景 3:磁盘故障:
# 从 VG 中移除故障磁盘
pvmove /dev/sdb # 将数据迁移到其他 PV
vgreduce vg0 /dev/sdb
pvremove /dev/sdb
最佳实践
- 1. LVM 为默认选择:新服务器统一使用 LVM,便于后期扩容与快照。
- 2. 分区规划:独立分区
/var、/var/log、/home,避免单点爆满。 - 3. 监控先行:扩容前检查 Prometheus 告警,扩容后验证监控恢复。
- 4. 快照保底:扩容前创建快照,快照大小 ≥ 变更期间写入量的 2 倍。
- 5. I/O 调度器匹配磁盘类型:SSD 使用
none,HDD 使用 mq-deadline。 - 6. 自动化清理:cron 定时清理日志(
journalctl --vacuum-time=30d)。 - 7. 容量预警阈值:80% 预警,85% 告警,90% 紧急。
- 8. 文件系统选择:数据库推荐 XFS(大文件高性能),通用场景 ext4 亦可。
- 9. 避免在线缩容:LVM 缩容高危,改为迁移数据到新 LV。
- 10. 定期测试恢复:每季度验证快照恢复与备份可用性。
附录
A. 完整 LVM 扩容脚本(幂等版)
#!/bin/bash
# 用途:安全扩容 LVM 逻辑卷
# 使用:./lvm_extend.sh /dev/sdb vg0 var +50G
set -euo pipefail
NEW_DISK=$1
VG_NAME=$2
LV_NAME=$3
EXTEND_SIZE=$4
# 检查磁盘是否已加入 LVM
if pvdisplay "$NEW_DISK" &>/dev/null; then
echo"$NEW_DISK 已是 PV,跳过 pvcreate"
else
echo"创建 PV: $NEW_DISK"
pvcreate "$NEW_DISK"
fi
# 检查 VG 是否已包含此 PV
if vgdisplay "$VG_NAME" | grep -q "$NEW_DISK"; then
echo"$NEW_DISK 已在 VG $VG_NAME,跳过 vgextend"
else
echo"扩展 VG: $VG_NAME"
vgextend "$VG_NAME""$NEW_DISK"
fi
# 扩展 LV
echo"扩展 LV: /dev/$VG_NAME/$LV_NAME"
lvextend -L "$EXTEND_SIZE""/dev/$VG_NAME/$LV_NAME"
# 扩展文件系统
MOUNT_POINT=$(findmnt -n -o TARGET --source"/dev/$VG_NAME/$LV_NAME")
FS_TYPE=$(findmnt -n -o FSTYPE --source"/dev/$VG_NAME/$LV_NAME")
if [[ "$FS_TYPE" == "xfs" ]]; then
echo"扩展 XFS 文件系统: $MOUNT_POINT"
xfs_growfs "$MOUNT_POINT"
elif [[ "$FS_TYPE" == "ext4" ]]; then
echo"扩展 ext4 文件系统"
resize2fs "/dev/$VG_NAME/$LV_NAME"
fi
# 验证
df -h "$MOUNT_POINT"
echo"扩容完成!"
B. fio 性能测试配置文件
; 保存为 fio-test.ini
[global]
ioengine=libaio
direct=1
iodepth=32
time_based
runtime=60
group_reporting
directory=/var/fio-test
[seqwrite]
rw=write
bs=4M
numjobs=1
stonewall
[seqread]
rw=read
bs=4M
numjobs=1
stonewall
[randwrite]
rw=randwrite
bs=4K
numjobs=4
stonewall
[randread]
rw=randread
bs=4K
numjobs=4
执行测试:
fio fio-test.ini --size=10G
C. Prometheus 告警规则示例
# prometheus-disk-alerts.yml
groups:
-name:disk_alerts
interval:30s
rules:
-alert:DiskSpaceHigh
expr:(1-node_filesystem_avail_bytes{mountpoint=~"/|/var"}/node_filesystem_size_bytes)*100>85
for:5m
labels:
severity:warning
annotations:
summary:"磁盘使用率 > 85% (实例: {{ $labels.instance }})"
description:"{{ $labels.mountpoint }} 使用率 {{ $value }}%"
-alert:DiskSpaceCritical
expr:(1-node_filesystem_avail_bytes{mountpoint=~"/|/var"}/node_filesystem_size_bytes)*100>90
for:2m
labels:
severity:critical
annotations:
summary:"磁盘使用率 > 90% (实例: {{ $labels.instance }})"
-alert:InodeUsageHigh
expr:(1-node_filesystem_files_free/node_filesystem_files)*100>90
for:5m
labels:
severity:warning
annotations:
summary:"inode 使用率 > 90% (实例: {{ $labels.instance }})"
-alert:DiskIOHigh
expr:rate(node_disk_io_time_seconds_total[5m])*100>80
for:10m
labels:
severity:warning
annotations:
summary:"磁盘 I/O 使用率 > 80% (实例: {{ $labels.instance }})"
D. 磁盘健康检查脚本
#!/bin/bash
# 磁盘 SMART 健康检查
for disk in /dev/sd? /dev/nvme?n?; do
[[ -e $disk ]] || continue
echo"=== 检查 $disk ==="
# 总体健康状态
smartctl -H $disk | grep -i "SMART overall-health"
# 关键指标(重新分配扇区、待处理扇区、不可纠正错误)
smartctl -A $disk | grep -E "Reallocated_Sector|Current_Pending_Sector|Offline_Uncorrectable"
# NVMe 额外检查
if [[ $disk =~ nvme ]]; then
smartctl -A $disk | grep -E "Media_Errors|Percentage_Used"
fi
echo""
done
添加到 cron(每日检查):
# 编辑 crontab
crontab -e
# 添加:
0 2 * * * /root/disk_health_check.sh | mail -s "Disk Health Report" admin@example.com
文档版本:1.0测试环境:RHEL 9.4、Ubuntu 24.04、Kernel 5.15+测试日期:2025-10
为了方便大家更好的交流运维等相关技术问题,创建了微信交流群,需要加群的小伙伴们可以扫一扫下面的二维码加我为好友拉您进群(备注:加群)。

| 代码仓库 | 网址 |
| Github | https://github.com/raymond999999 |
| Gitee | https://gitee.com/raymond9 |
| 博客 | 网址 |
| https://blog.csdn.net/qq_25599925 |
| 稀土掘金 | https://juejin.cn/user/4262187909781751 |
| 知识星球 | https://wx.zsxq.com/group/15555885545422 |
| 阿里云社区 | https://developer.aliyun.com/profile/snzh3xpxaf6sg |
| 腾讯云社区 | https://cloud.tencent.com/developer/user/11823619 |
| 华为云社区 | https://developer.huaweicloud.com/usercenter/mycommunity/dynamics |
访问博客网站,查看更多优质原创内容。