保姆级教程：在Ubuntu 20.04上从Anaconda到TensorRT 8.0的完整环境搭建（含CUDA 11.0和cuDNN 8.0配置）-洪萨配资

深度学习环境搭建实战：Ubuntu 20.04下TensorRT 8.0全链路配置指南

刚接触深度学习的开发者常被环境配置劝退——NVIDIA驱动、CUDA、cuDNN、TensorRT的版本依赖如同精密齿轮，一个环节出错就导致整个系统无法运转。本文将手把手带你完成从裸机到TensorRT推理环境的完整搭建，重点解决三个核心问题：版本精确匹配、环境隔离管理和生产级验证。不同于碎片化的网络教程，我们采用Anaconda虚拟环境+系统级组件的混合方案，既保证环境纯净又可复用已有组件。

1. 基础环境准备与版本规划

在开始安装前，必须明确各组件的版本对应关系。TensorRT 8.0的官方兼容矩阵显示，其必须搭配CUDA 11.0和cuDNN 8.0.x。以下是经过验证的组件组合：

组件	推荐版本	验证方式
Ubuntu OS	20.04 LTS	`lsb_release -a`
NVIDIA驱动	470.82.01	`nvidia-smi`
CUDA	11.0.3	`nvcc --version`
cuDNN	8.0.5	`cat /usr/include/cudnn_version.h`
TensorRT	8.0.0.3	`dpkg -l

关键提示：切勿直接安装最新版本驱动！NVIDIA 495+驱动会强制升级CUDA到11.5，导致与TensorRT 8.0不兼容。

1.1 系统初始化配置

首先更新系统并安装编译工具链：

sudo apt update && sudo apt upgrade -y sudo apt install -y build-essential cmake unzip

禁用默认的nouveau驱动（常见冲突源）：

sudo bash -c "echo 'blacklist nouveau' >> /etc/modprobe.d/blacklist.conf" sudo bash -c "echo 'options nouveau modeset=0' >> /etc/modprobe.d/blacklist.conf" sudo update-initramfs -u

重启后执行lsmod | grep nouveau应无输出。

2. 精准安装NVIDIA驱动与CUDA工具包

2.1 驱动安装避坑指南

添加官方PPA源并安装470分支驱动：

sudo add-apt-repository ppa:graphics-drivers/ppa sudo apt update ubuntu-drivers devices | grep recommended sudo apt install -y nvidia-driver-470

验证驱动是否生效：

nvidia-smi

正常输出应包含类似信息：

+-----------------------------------------------------------------------------+ | NVIDIA-SMI 470.82.01 Driver Version: 470.82.01 CUDA Version: 11.4 | |-------------------------------+----------------------+----------------------+

注意：此处显示的CUDA版本是驱动支持的最高版本，实际CUDA运行时版本由后续安装决定。

2.2 CUDA 11.0定制化安装

从NVIDIA存档库下载特定版本：

wget https://developer.download.nvidia.com/compute/cuda/11.0.3/local_installers/cuda_11.0.3_450.51.06_linux.run sudo sh cuda_11.0.3_450.51.06_linux.run

安装时务必取消勾选Driver选项（已安装驱动）：

[ ] Driver [X] CUDA Toolkit 11.0 [ ] CUDA Samples

配置环境变量到~/.bashrc：

export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}} export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

验证CUDA编译器：

nvcc --version

应输出release 11.0, V11.0.221

3. Anaconda环境与cuDNN配置

3.1 创建Python隔离环境

使用Miniconda更轻量级：

wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh

创建专用环境并安装基础工具包：

conda create -n tensorrt python=3.8 -y conda activate tensorrt pip install numpy pycuda

3.2 cuDNN手动部署

下载cuDNN 8.0.5 for CUDA 11.0（需NVIDIA开发者账号）后执行：

tar -xzvf cudnn-11.0-linux-x64-v8.0.5.39.tgz sudo cp cuda/include/cudnn*.h /usr/local/cuda-11.0/include sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.0/lib64 sudo chmod a+r /usr/local/cuda-11.0/include/cudnn*.h

验证cuDNN可用性：

import tensorflow as tf print(tf.config.list_physical_devices('GPU'))

无报错即表示基础环境正常。

4. TensorRT 8.0深度集成

4.1 二进制包安装

下载TensorRT 8.0.0.3 for CUDA 11.0的tar包：

tar -xzvf TensorRT-8.0.0.3.Linux.x86_64-gnu.cuda-11.0.cudnn8.0.tar.gz export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$(pwd)/TensorRT-8.0.0.3/lib

安装Python wheel（需匹配Python版本）：

cd TensorRT-8.0.0.3/python pip install tensorrt-8.0.0.3-cp38-none-linux_x86_64.whl

4.2 生产环境验证方案

运行官方示例前需编译插件：

cd TensorRT-8.0.0.3/samples/python/end_to_end_tensorflow_mnist make -j$(nproc)

完整验证流程应包含：

模型转换测试（ONNX→TensorRT）
推理速度基准测试
精度对比验证

示例性能基准（GTX 1660 Ti）：

测试项	FP32延迟(ms)	FP16延迟(ms)
原始TensorFlow	15.2	不支持
TensorRT优化后	6.8	3.2

5. 故障排查与性能调优

5.1 常见错误解决方案

动态库找不到问题：

sudo ldconfig /usr/local/cuda-11.0/lib64

CUDA与驱动版本冲突：

sudo apt purge nvidia-* sudo apt install nvidia-driver-470

5.2 性能优化技巧

启用FP16模式提升吞吐量：

config = builder.create_builder_config() config.set_flag(trt.BuilderFlag.FP16)

使用TensorRT的DLACore加速（仅限专业卡）：

config.DLA_CORE = 0

环境搭建完成后，实际部署时建议使用Docker固化环境：

FROM nvidia/cuda:11.0-cudnn8-runtime-ubuntu20.04 COPY TensorRT-8.0.0.3 /opt/tensorrt ENV LD_LIBRARY_PATH /opt/tensorrt/lib:$LD_LIBRARY_PATH

保姆级教程：在Ubuntu 20.04上从Anaconda到TensorRT 8.0的完整环境搭建（含CUDA 11.0和cuDNN 8.0配置）

深度学习环境搭建实战：Ubuntu 20.04下TensorRT 8.0全链路配置指南

1. 基础环境准备与版本规划

1.1 系统初始化配置

2. 精准安装NVIDIA驱动与CUDA工具包

2.1 驱动安装避坑指南

2.2 CUDA 11.0定制化安装

3. Anaconda环境与cuDNN配置

3.1 创建Python隔离环境

3.2 cuDNN手动部署

4. TensorRT 8.0深度集成

4.1 二进制包安装

4.2 生产环境验证方案

5. 故障排查与性能调优

5.1 常见错误解决方案

5.2 性能优化技巧

Vivado FIR IP核配置避坑指南：从Coefficient Quantization到AXI-Stream接口，这些参数你真的设对了吗？

超越官方教程：用ROS2 camera_calibration工具包高效标定USB相机的完整流程

NSC_BUILDER终极指南：如何轻松管理Switch游戏文件库的完整教程

C++内存分配器选型指南：除了GLibc，为什么JeMalloc在高并发场景下更值得一试？

别再怕CANOpen协议栈！一个通用函数搞定直流无刷电机读写控制

2026多Agent通信与协调深度解析 OpenClaw Gateway架构实战智能体网络标准化

深度学习环境搭建实战：Ubuntu 20.04下TensorRT 8.0全链路配置指南

1. 基础环境准备与版本规划

1.1 系统初始化配置

2. 精准安装NVIDIA驱动与CUDA工具包

2.1 驱动安装避坑指南

2.2 CUDA 11.0定制化安装

3. Anaconda环境与cuDNN配置

3.1 创建Python隔离环境

3.2 cuDNN手动部署

4. TensorRT 8.0深度集成

4.1 二进制包安装

4.2 生产环境验证方案

5. 故障排查与性能调优

5.1 常见错误解决方案

5.2 性能优化技巧

Vivado FIR IP核配置避坑指南：从Coefficient Quantization到AXI-Stream接口，这些参数你真的设对了吗？

超越官方教程：用ROS2 camera_calibration工具包高效标定USB相机的完整流程

NSC_BUILDER终极指南：如何轻松管理Switch游戏文件库的完整教程

C++内存分配器选型指南：除了GLibc，为什么JeMalloc在高并发场景下更值得一试？

别再怕CANOpen协议栈！一个通用函数搞定直流无刷电机读写控制

2026多Agent通信与协调深度解析 OpenClaw Gateway架构实战 智能体网络标准化

2026多Agent通信与协调深度解析 OpenClaw Gateway架构实战智能体网络标准化