# 更新系统
sudo apt update && sudo apt upgrade -y
# 安装编译工具
sudo apt install build-essential gcc make -y
# 安装必要的库
sudo apt install linux-headers-$(uname -r) -y方法一:通过官方 PPA 安装(推荐)
# 添加 NVIDIA 官方 PPA
sudo add-apt-repository ppa:graphics-drivers/ppa -y
sudo apt update
# 安装驱动(CUDA 12.8 需要 550.x 驱动)
sudo apt install nvidia-driver-550 -y
# 或安装最新的驱动
# sudo apt install nvidia-driver-550-open -y方法二:从 .run 文件安装(包含在 CUDA 安装中)
# 方法一:使用 wget 下载
wget wget https://developer.download.nvidia.com/compute/cuda/12.8.0/local_installers/cuda_12.8.0_570.86.10_linux.run
# 方法二:通过命令行下载(自动选择合适版本)
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin
sudomv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600# 赋予执行权限
chmod +x cuda_12.8.0_570.86.10_linux.run
# 运行安装程序
sudo ./cuda_12.8.0_570.86.10_linux.run安装选项说明:
q 跳过协议阅读accept 接受协议DriverCUDA Toolkit 12.8 勾选/usr/local/cuda-12.8# 添加 CUDA 仓库
sudo apt-key del 7fa2af80
wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-keyring_1.1-1_all.deb
sudo dpkg -i cuda-keyring_1.1-1_all.deb
sudo apt update
# 安装 CUDA 12.8
sudo apt install cuda-12-8 -y编辑 ~/.bashrc:
nano ~/.bashrc添加以下内容:
# CUDA 配置
export PATH=/usr/local/cuda-12.8/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDA_HOME=/usr/local/cuda-12.8
# 或者使用符号链接(可选)
# export PATH=/usr/local/cuda/bin${PATH:+:${PATH}}
# export LD_LIBRARY_PATH=/usr/local/cuda/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}使配置生效:
source ~/.bashrc如果需要为所有用户配置:
# 创建配置文件
sudotee /etc/profile.d/cuda.sh > /dev/null << 'EOF'
export PATH=/usr/local/cuda-12.8/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.8/lib64:$LD_LIBRARY_PATH
EOF
# 重新登录或重启# 创建指向当前版本的符号链接
sudoln -sf /usr/local/cuda-12.8 /usr/local/cuda# 检查 CUDA 编译器
nvcc --version
# 应该显示:Cuda compilation tools, release 12.8, V12.8.xxx
# 检查 GPU 状态
nvidia-smi
# 应该显示 CUDA Version: 12.8
# 验证设备
/usr/local/cuda-12.8/extras/demo_suite/deviceQuery# 从 NVIDIA 官网下载 cuDNN(需要注册)
# 下载地址:https://developer.nvidia.com/cudnn
# 下载后安装
tar -xvf cudnn-linux-x86_64-8.9.x.x_cuda12-archive.tar.xz
sudocp cudnn-*-archive/include/cudnn*.h /usr/local/cuda-12.8/include
sudocp -P cudnn-*-archive/lib/libcudnn* /usr/local/cuda-12.8/lib64
sudochmod a+r /usr/local/cuda-12.8/include/cudnn*.h /usr/local/cuda-12.8/lib64/libcudnn*
# 验证 cuDNN
cat /usr/local/cuda-12.8/include/cudnn_version.h | grep CUDNN_MAJOR -A 2问题1:驱动冲突
# 移除旧驱动
sudo apt purge nvidia-* cuda-*
sudo apt autoremove -y
# 重新安装
sudo ubuntu-drivers autoinstall
sudo apt install nvidia-driver-550问题2:内核模块未加载
# 查看驱动状态
lsmod | grep nvidia
# 如果未加载,尝试
sudo modprobe nvidia问题3:Secure Boot 阻止安装
# 禁用 Secure Boot
sudo mokutil --disable-validation
# 重启后按提示操作问题4:Nouveau 冲突
# 检查是否加载了 Nouveau
lsmod | grep nouveau
# 如果存在,创建黑名单
sudotee /etc/modprobe.d/blacklist-nouveau.conf > /dev/null << 'EOF'
blacklist nouveau
options nouveau modeset=0
EOF
sudo update-initramfs -u
sudo reboot# 如果通过 .run 文件安装
sudo /usr/local/cuda-12.8/bin/cuda-uninstaller
# 如果通过 apt 安装
sudo apt purge cuda-* nvidia-*
sudo apt autoremove -y# 查看 GPU 状态
nvidia-smi
nvidia-smi -q
# 查看 CUDA 版本
nvcc --version
cat /usr/local/cuda/version.txt
# 监控 GPU
nvidia-smi -l 1 # 每秒更新一次
watch -n 1 nvidia-smisudo apt update && sudo apt upgrade安装完成后,可以通过运行深度学习框架的测试代码来验证安装完整性。