承接上期基础运维速查,本篇为纯运维进阶完整版,剔除所有合规相关内容,专注麒麟V10/V11、统信UOS桌面/服务器版日常运维、故障排查、系统管控、性能优化、应急修复,命令详解+分步操作+避坑提示,全是一线运维高频实用技能,新手也能快速上手。
一、系统服务与进程进阶管控
1. Systemd服务精细化管理(麒麟/统信通用)
bash
# 查看服务完整状态(含启动日志、依赖、报错信息)
systemctl status 服务名 -l
# 重新加载服务配置(不重启服务、不中断业务)
systemctl reload 服务名
# 查看服务开机自启状态
systemctl is-enabled 服务名
# 查看所有服务(含开机自启、禁用、启动失败状态)
systemctl list-unit-files --type=service
# 筛选运行中的服务
systemctl list-units --type=service --state=running
# 排查服务启动失败原因(近10分钟日志)
journalctl -u 服务名 --since "10分钟前"
# 信创办公核心服务操作
## 打印+扫描服务
systemctl restart cups saned
## 网络管理服务
systemctl restart NetworkManager
## SSH远程连接服务
systemctl restart sshd
## 图形桌面服务(适配双系统)
systemctl restart lightdm # 麒麟V10/统信UOS专用
systemctl restart gdm3 # 麒麟V11专用
2. 进程深度管控与资源排查
bash
# 安装高效进程监控工具
sudo apt install htop -y
# 实时监控CPU、内存、进程(替代top)
htop
# 查看进程完整启动命令
ps aux | grep 进程名
# 按内存占用从高到低排序(前15个)
ps aux --sort=-%mem | head -15
# 按CPU占用从高到低排序(前15个)
ps aux --sort=-%cpu | head -15
# 优雅终止进程(优先用,不损坏数据)
kill -15 PID
# 强制卡死进程(无响应时使用)
kill -9 PID
# 批量关闭同类进程
pkill -15 进程名
pkill -9 进程名
# 查看进程占用的文件、端口
lsof -p PID
二、磁盘管理与文件系统进阶
1. 磁盘分区、格式化与永久挂载
bash
# 1. 识别硬盘与分区(查看新硬盘)
lsblk
fdisk -l
# 2. 新建硬盘分区
fdisk /dev/sdb
# 操作步骤:n→p→连续回车默认→w(保存分区)
# 3. 分区格式化(Linux标准ext4格式)
mkfs.ext4 /dev/sdb1
# 4. 创建挂载目录
mkdir -p /data
# 5. 查询分区UUID(永久挂载必备)
blkid /dev/sdb1
# 6. 编辑开机自动挂载配置
vim /etc/fstab
# 添加以下内容(替换为自己的UUID)
UUID=你的分区UUID /data ext4 defaults 0 0
# 7. 验证配置(关键!避免开机无法启动)
mount -a
# 无报错即配置正常,重启后自动挂载
2. 磁盘空间爆满清理
bash
# 查看根目录各文件夹占用大小
du -sh /* | sort -hr
# 查找系统内大于1G的大文件
find / -type f -size +1G | sort -hr | head -10
# 清理系统安装缓存与无用依赖
sudo apt clean
sudo apt autoremove -y
sudo apt autoclean
# 安全清空超大日志文件(不删除、不影响服务)
truncate -s 0 /var/log/syslog
truncate -s 0 /var/log/auth.log
# 删除过期归档日志
rm -rf /var/log/*.gz /var/log/*.old /var/log/*.1
3. 文件权限与属主修复
bash
# 递归修复文件夹权限(通用可读可执行)
chmod -R 755 /目标文件夹
# 递归修复文件权限(通用可读)
chmod -R 644 /目标文件
# 递归修复用户目录归属(解决无法登录、权限不足)
chown -R 用户名:用户名 /home/用户名
# 修复系统核心文件权限
chmod 644 /etc/passwd /etc/group
chmod 600 /etc/shadow
三、网络运维与防火墙实操
1. 网络故障排查常用命令
bash
# 查看网卡IP、MAC等详细信息
ip addr
ip a
# 查看系统路由与网关
ip route
route -n
# 测试网络连通性(ping4次自动停止)
ping 网关IP -c 4
ping www.baidu.com -c 4
# 查看本机端口占用(精准定位服务)
ss -lntup
netstat -lntup
# 测试远程服务器端口是否开放
telnet 目标IP 端口
nc -zv 目标IP 端口
# 重启网络服务(解决断网、无IP、连不上WiFi)
sudo systemctl restart NetworkManager
# 重新加载网络配置
sudo nmcli connection reload
2. 防火墙(UFW)运维操作
bash
# 查看防火墙状态与所有规则
sudo ufw status verbose
# 开启/关闭防火墙
sudo ufw enable
sudo ufw disable
# 允许指定端口通行
sudo ufw allow 22/tcp # SSH远程
sudo ufw allow 631/tcp # 打印扫描
sudo ufw allow 80/tcp # 网页访问
sudo ufw allow 443/tcp # 加密网页
# 允许局域网所有设备访问
sudo ufw allow from 192.168.1.0/24
# 删除指定防火墙规则
sudo ufw delete allow 22/tcp
# 重载防火墙规则
sudo ufw reload
四、系统日志精准排查(故障定位)
bash
# 实时刷新查看系统日志
journalctl -f
# 查看今日所有系统日志
journalctl --since today
# 查看本次开机启动日志(排查开机故障)
journalctl -b
# 查看SSH远程登录日志
journalctl -u sshd --since "1天前"
# 查看打印扫描服务日志
journalctl -u cups --since "1小时前"
# 实时查看用户认证、权限日志
tail -f /var/log/auth.log
# 导出系统日志到文件
journalctl > /home/system_log.txt
五、应急故障修复
1. 忘记系统登录密码重置
1. 开机进入GRUB引导菜单,按 e 进入编辑模式
2. 找到以 linux 开头的行,末尾添加 init=/bin/bash
3. 按 Ctrl+X 进入单用户模式
4. 挂载根目录可读写: mount -o remount,rw /
5. 重置密码: passwd 用户名 (输入两次新密码)
6. 执行 exec /sbin/init 重启系统
2. fstab配置错误导致无法开机
1. 开机进入系统救援模式,输入管理员密码
2. 挂载根目录: mount -o remount,rw /
3. 编辑错误配置: vim /etc/fstab
4. 注释或删除错误的挂载行,保存退出
5. 执行 mount -a 验证,无报错后重启
3. 图形桌面循环登录/黑屏
bash
# 方法1:重启图形桌面服务
sudo systemctl stop lightdm
sudo systemctl start lightdm
# 方法2:修复用户目录权限异常
sudo chown -R $USER:$USER /home/$USER
# 方法3:删除桌面缓存配置
rm -rf ~/.cache ~/.config/*
4. 删除用户提示“用户已登录”无法删除
bash
# 强制踢出用户所有进程
pkill -u 用户名
# 再执行删除用户操作
userdel -r 用户名
六、系统优化与备份还原
1. 系统性能与开机优化
bash
# 查看系统开机耗时
systemd-analyze
# 查看开机自启服务耗时排行
systemd-analyze blame
# 关闭无需开机自启的服务
sudo systemctl disable 服务名
# 清理用户端缓存垃圾
rm -rf ~/.cache/*
2. 文件备份与还原
bash
# 备份用户数据(按日期命名,避免覆盖)
tar -zcvf /备份路径/backup_$(date +%Y%m%d).tar.gz /home /桌面
# 备份系统核心配置文件
tar -zcvf etc_backup.tar.gz /etc
# 还原备份文件
tar -zxvf 备份文件名.tar.gz -C /
# 本地文件传输到远程电脑
scp 本地文件路径 远程用户名@远程IP:/远程保存路径
📌 运维实操避坑提示
1. 执行 rm -rf 命令务必核对路径,严禁直接运行 rm -rf /* ,防止系统崩溃
2. 修改 /etc/fstab 后,必须执行 mount -a 验证,再重启系统
3. 修改系统配置文件前,先备份原文件,方便故障快速回滚
4. 服务重启、进程关闭前,确认无业务在运行,避免影响使用
5. 麒麟、统信系统命令通用。