为什么用:深度学习涉及海量矩阵运算,使用 CPU(中央处理器)相当于让几个老教授算数,而使用 GPU 结合 CUDA 则相当于雇佣了成千上万个小学生同时进行计算,效率呈指数级跃升。
怎么做:配置环境的核心在于确保这三者的版本匹配,否则引擎将无法启动。
检查 NVIDIA 显卡与安装显卡驱动
安装细节:在 Windows 系统中,右键桌面或使用任务管理器的“性能”选项卡可以查看显卡型号。随后需前往 NVIDIA 官网,根据具体的显卡型号下载并安装最新的 Game Ready 或 Studio 驱动程序。安装完成后,在命令行输入 nvidia-smi 即可验证显卡状态与当前驱动支持的最高 CUDA 版本。
安装 CUDA 与版本匹配问题
安装细节:根据 nvidia-smi 显示的 CUDA Version 上限,前往 NVIDIA 开发者官网下载对应或稍低版本的 CUDA Toolkit。安装时选择“精简”模式即可。需注意的是,深度学习框架(如 PyTorch)通常自带精简版 CUDA,因此系统级 CUDA 的安装在某些纯 Python 开发场景下并非强制要求,但为了后续编译复杂依赖,建议完整安装。