Cách cài đặt CUDA trên Windows: Hướng dẫn và giải pháp đầy đủ

  • Khả năng tương thích: Hỗ trợ các phiên bản Windows và Visual Studio và ngừng hỗ trợ chuỗi công cụ 32-bit kể từ CUDA 12.
  • Cài đặt linh hoạt: trình cài đặt đầy đủ hoặc qua mạng, chế độ im lặng, Conda hoặc Wheels với gói meta cu12/cu129.
  • Xác minh và xây dựng: nvcc, deviceQuery/bandwidthTest, tích hợp Visual Studio và $(CUDA_PATH).
  • WSL và các trường hợp đặc biệt: Trình điều khiển dành riêng cho WSL, kernel 5.10.43.3+ và các phụ thuộc của Model Builder với CUDA 10.1/cuDNN 7.6.4.

CUDA trên NVIDIA Windows là gì?

Việc cài đặt CUDA trên Windows sẽ không còn là vấn đề nếu bạn biết cách tìm đúng và phù hợp với phiên bản nào. Trong hướng dẫn thực tế này, tôi sẽ hướng dẫn bạn từng bước để cài đặt bộ công cụ, trình điều khiển phù hợp và các tiện ích xác minh, cả trên Windows gốc và sử dụng WSL. Mục đích là để "hạ gục" GPU của bạn. thực sự đang tăng tốc khối lượng công việc của bạn mà không gặp phải bất ngờ về khả năng tương thích.

Ngoài phần cài đặt cơ bản, tôi sẽ đề cập đến các trường hợp sử dụng thực tế và các yêu cầu đặc biệt (chẳng hạn như ML.NET Model Builder với các phụ thuộc cũ), các lựa chọn cài đặt thay thế với Conda và pip, tích hợp với Visual Studio và các bài kiểm tra deviceQuery và bandwidthTest cổ điển. Bạn cũng sẽ được hướng dẫn cách chẩn đoán các vấn đề điển hình của trình điều khiển, phát hiện GPU và phiên bản CUDA không khớp thường làm chậm mọi người lần đầu tiên.

CUDA là gì và tại sao nó lại quan trọng trên Windows?

CUDA là nền tảng và mô hình của Lập trình NVIDIA cho phép bạn chuyển giao những phần nặng nhất của ứng dụng sang GPU. CPU xử lý các tác vụ tuần tự và GPU xử lý các tác vụ khác. song song rất lớn, mỗi phần có bộ nhớ riêng, tránh tình trạng tắc nghẽn và cho phép làm việc đồng thời.

GPU hỗ trợ CUDA có hàng trăm hoặc hàng nghìn lõi chạy hàng chục nghìn luồng. Các thư viện như cuBLAS, cuDNN và NVCC hoàn thiện bộ công cụ để bạn có thể biên dịch, gỡ lỗi và lập hồ sơ phần mềm tăng tốc GPU trên Windows.

Tại sao IBM tạo ra Trải nghiệm lượng tử
Bài viết liên quan:
Trải nghiệm lượng tử: Nó là gì và dùng để làm gì

Yêu cầu hệ thống và khả năng tương thích trên Windows

Trước hết, bạn cần kiểm tra xem hệ thống của bạn có tương thích với bộ công cụ bạn muốn hay không. Trên các hệ thống Windows hiện tại, Hỗ trợ CUDA 13.0 U1: Windows 11 24H2, 23H2, 22H2-SV2; Windows 10 22H2; Windows Server 2022 và 2025.

Trình biên dịch và IDE được hỗ trợ: Visual Studio 2022 17.x (MSVC 193x) với C++11/14/17/20 và Visual Studio 2019 16.x (MSVC 192x) với C++11/14/17. hỗ trợ cho VS2017 Tính năng này đã bị loại bỏ trong CUDA 13.0 và đã ngừng hoạt động kể từ VS2015 kể từ CUDA 11.1, vì vậy hãy điều chỉnh dự án của bạn.

Lưu ý quan trọng về 32-bit: Kể từ CUDA 12.0, không còn toolchain 32-bit (gốc hoặc đa nền tảng). Trình điều khiển sẽ tiếp tục chạy các tệp nhị phân 32-bit trên GeForce. Kiến trúc Ada; Hopper không còn hỗ trợ 32 bit nữa.

Phần cứng được đề xuất: GPU NVIDIA có Khả năng Tính toán phù hợp với phiên bản của bạn (đối với các tình huống chung, 3.0 trở lên; xem danh sách chính thức), bộ nhớ đủ dùng và trong một số trường hợp cụ thể, yêu cầu cao hơn. Đối với Model Builder (phân loại hình ảnh), ít nhất 6 GB VRAM chuyên dụng, trong khi đối với mục đích sử dụng cơ bản thì dung lượng tối thiểu là 4 GB.

Kiểm tra xem bạn có GPU tương thích không và bạn có phiên bản nào

Cài đặt CUDA trên Windows

Để kiểm tra mẫu GPU của bạn trong Windows: Cài đặt > Hệ thống > Hiển thị > Cài đặt nâng cao. Ở đó bạn sẽ thấy nhãn hiệu và kiểu máy trong mục Thông tin hiển thị, rất hữu ích để xác nhận khả năng tương thích.

Bạn cũng có thể sử dụng Trình quản lý tác vụ trên tab Hiệu suất và chọn bảng GPU để xem chi tiết. Nếu không thấy, hãy mở Trình quản lý thiết bị và xem Bộ điều hợp hiển thị; Nếu trình điều khiển NVIDIA bị thiếu, hãy cài đặt nó.

Để kiểm tra cài đặt CUDA, hãy mở PowerShell hoặc CMD và chạy nvcc --version o nvcc -V. Điều này trả về phiên bản trình biên dịch NVCC đã cài đặt; nếu không phản hồi, thì PATH của bộ công cụ chưa được cấu hình hoặc chưa được cài đặt đúng cách.

Nếu bạn cần cập nhật trình điều khiển, GeForce Experience sẽ đề xuất phiên bản mới nhất hoặc tải xuống từ trang web trình điều khiển chính thức của NVIDIA. Việc cập nhật trình điều khiển thường sẽ giải quyết được vấn đề. sự không tương thích của bộ công cụ và lỗi phát hiện.

Tải xuống NVIDIA CUDA Toolkit: Định dạng và Tính toàn vẹn

Truy cập trang tải xuống CUDA chính thức của NVIDIA và chọn Windows. Bạn có thể chọn Trình cài đặt mạng (tải xuống tối thiểu, sau đó là các gói theo yêu cầu) hoặc Trình cài đặt đầy đủ (bao gồm tất cả mọi thứ). Trình cài đặt đầy đủ rất phù hợp cho máy tính ngoại tuyến hoặc triển khai doanh nghiệp.

Sau khi tải xuống, bạn nên kiểm tra mã kiểm tra MD5 đã công bố để đảm bảo tệp không bị hỏng. Nếu mã băm không khớp, tải lại trình cài đặt và tránh những rắc rối sau này.

Kể từ CUDA 13, trình điều khiển NVIDIA không còn được bao gồm trong Bộ công cụ. Cài đặt trình điều khiển riêng biệt với Trang trình điều khiển NVIDIA và sau đó là Bộ công cụ; tránh trộn lẫn các phiên bản không tương thích.

Cài đặt trên Windows: chế độ đồ họa, im lặng và trích xuất

Cài đặt đồ họa: Chạy trình cài đặt và làm theo các bước. Chọn vị trí, chấp nhận giấy phép và chọn thành phần chẳng hạn như Toolkit, Nsight Compute/Systems và các ví dụ.

Cài đặt im lặng: Bạn có thể khởi chạy trình cài đặt bằng -s cho chế độ im lặng và thêm tham số cho các gói con cụ thể. Nếu bạn không muốn tự động khởi động lại, hãy thêm -n và bạn quản lý việc khởi động lại ở cuối.

Giải nén thủ công: Với 7-Zip/WinZip, bạn có thể giải nén toàn bộ gói để kiểm tra nội dung. Bộ công cụ nằm bên trong thư mục. Bộ công cụ CUDA và tích hợp Visual Studio trong thư mục cùng tên; các tệp .dll và .nvi mà bạn thấy trong thư mục gốc của trình cài đặt không phải là các tệp có thể cài đặt được.

Đường dẫn bộ công cụ mặc định: C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v13.0. Khi cài đặt các gói con Bạn chỉ có thể chọn những gì bạn cần (ví dụ, nvcc_13.0 đối với trình biên dịch, cudart_13.0 cho thời gian chạy, cublas_13.0/cublas_dev_13.0, cufft_13.0, curand_13.0, cusolver_13.0, cusparse_13.0, nsight_compute_13.0, nsight_systems_13.0, nvrtc_13.0, nvdisasm_13.0, nvprune_13.0, opencl_13.0, sanitizer_13.0, thrust_13.0, Vv). Bằng cách này, bạn giảm được diện tích chiếm dụng và thời gian lắp đặt.

Gỡ cài đặt: Có thể gỡ bỏ tất cả các gói con từ Control Panel > Programs and Features. Hữu ích nếu bạn muốn cài đặt lại phiên bản. dọn dẹp hoặc thay đổi nhánh mà không để lại bất kỳ dấu vết nào.

Các mô hình trình điều khiển trong Windows: WDDM so với TCC

Trên Windows 10 trở lên, trình điều khiển NVIDIA có thể hoạt động ở hai chế độ: WDDM (dành cho thiết bị hiển thị) và TCC (dành cho GPU tính toán như Tesla hoặc một số Titan). Bạn có thể kiểm tra và thay đổi chế độ bằng nvidia-smi trên các card được hỗ trợ; hầu hết các card GeForce hiện đại đều sử dụng WDDM theo mặc định.

Xác minh cài đặt: nvcc, mẫu và thử nghiệm

Kiểm tra phiên bản NVCC với nvcc -V. Nếu lệnh hoạt động, PATH và cài đặt cơ bản đã được thực hiện.

Sao chép các mẫu CUDA từ GitHub tại nvidia/cuda-samples, biên dịch chúng và chạy chúng deviceQuery. Nó sẽ phát hiện thiết bị của bạn và trả về bài kiểm tra đã vượt qua; nếu không, hãy kiểm tra trình điều khiển và phần cứng.

Cũng chạy bandwidthTest để xác thực băng thông thiết bị chủ. Nếu các bài kiểm tra vượt qua, giao tiếp CPU-GPU không sao. Mọi lỗi ở đây thường liên quan đến trình điều khiển hoặc cài đặt Bộ công cụ.

Tích hợp với Visual Studio và cơ sở hạ tầng dự án

Các mẫu và dự án của bạn có thể được biên dịch bằng các giải pháp VS 2019/2022. Các mẫu NVIDIA thiết lập một dự án C++ với Xây dựng tùy chỉnh của CUDA cho phiên bản của bạn (ví dụ: CUDA 13.0 Runtime).

Tệp .props của bộ công cụ: VS 2019 có các props trong C:\Program Files (x86)\Microsoft Visual Studio\2019\Professional\MSBuild\Microsoft\VC\v160\BuildCustomizations và VS 2022 trong C:\Program Files\Microsoft Visual Studio\2022\Professional\MSBuild\Microsoft\VC\v170\BuildCustomizations. Các tuyến đường này cho phép VS tìm thấy quy tắc và thuộc tính từ CUDA.

Trong các dự án mới, hãy tạo từ NVIDIA Templates > CUDA cho phiên bản đã cài đặt. Trong các dự án hiện có, hãy đi tới Xây dựng các phụ thuộc > Xây dựng các tùy chỉnh và đánh dấu phiên bản CUDA của bạn hoặc trỏ đến $(CUDA_PATH) nếu bạn muốn luôn sử dụng phiên bản mới nhất được cài đặt.

Sau khi cài đặt hoặc gỡ cài đặt Bộ công cụ, hãy xác thực rằng $(CUDA_PATH) trỏ đến thư mục chính xác. Truy cập Các biến môi trường từ Thuộc tính hệ thống để kiểm tra và điều chỉnh giá trị nếu cần.

Các tệp có mã CUDA phải được đánh dấu là loại CUDA C/C++. Bạn có thể thêm chúng từ Thêm mục mới > NVIDIA CUDA 13.0 > Mã CUDA C/C++ trong Visual Studio.

Cài đặt CUDA với Conda và pip

Conda: NVIDIA phát hành các gói trên kênh Anaconda của mình (anaconda.org/nvidia) để cài đặt Bộ công cụ đầy đủ hoặc các phiên bản trước đó cụ thể. Để ghim phiên bản trước đó, hãy thêm nhãn phát hành vào lệnh cài đặt và Conda sẽ giải quyết các vấn đề phụ thuộc.

Cách ghim thư mục vào menu Bắt đầu của Windows 11
Bài viết liên quan:
Tệp GGUF là gì?

pip: NVIDIA cung cấp Wheels để cài đặt các thành phần CUDA chủ yếu hướng đến thời gian chạy Python. Cài đặt đầu tiên nvidia-pyindex và đảm bảo bạn đã cập nhật pip và setuptools. Bạn có thể thêm dòng tương ứng vào requirements.txt Nếu bạn thích.

Các gói siêu dữ liệu trên Windows dành cho CUDA 12 (cu12) được lấy từ phiên bản mới nhất hiện có: trong số những người khác, nvidia-cublas-cu12, nvidia-cuda-cccl-cu12, nvidia-cuda-cupti-cu12, nvidia-cuda-nvcc-cu12, nvidia-cuda-nvrtc-cu12, nvidia-cuda-opencl-cu12, nvidia-cuda-runtime-cu12, nvidia-cuda-sanitizer-api-cu12, nvidia-cufft-cu12, nvidia-curand-cu12, nvidia-cusolver-cu12, nvidia-cusparse-cu12, nvidia-npp-cu12, nvidia-nvfatbin-cu12, nvidia-nvjitlink-cu12, nvidia-nvjpeg-cu12, nvidia-nvml-dev-cu12, nvidia-nvtx-cu12.

Các gói siêu dữ liệu này cài đặt các gói có phiên bản cụ thể, ví dụ với hậu tố cu129: nvidia-cublas-cu129, nvidia-cuda-cccl-cu129, nvidia-cuda-cupti-cu129, nvidia-cuda-nvcc-cu129, nvidia-cuda-nvrtc-cu129, nvidia-cuda-opencl-cu129, nvidia-cuda-runtime-cu129, nvidia-cuda-sanitizer-api-cu129, nvidia-cufft-cu129, nvidia-curand-cu129, nvidia-cusolver-cu129, nvidia-cusparse-cu129, nvidia-npp-cu129, nvidia-nvfatbin-cu129, nvidia-nvjitlink-cu129, nvidia-nvjpeg-cu129, nvidia-nvml-dev-cu129, nvidia-nvtx-cu129. Hãy nhớ rằng CUDA Wheels không bao gồm các công cụ dành cho nhà phát triển, chỉ có thời gian chạy.

Sử dụng pip có nghĩa là môi trường CUDA được liên kết với môi trường Python của bạn. Nếu bạn định biên dịch hoặc chạy bên ngoài môi trường đó, hãy cài đặt thêm Bộ công cụ cấp hệ thống để tránh sự không nhất quán của lộ trình.

CUDA trên WSL: Windows 11 và Windows 10 21H2

Windows 11 và Windows 10 21H2 (trở lên) cho phép bạn chạy các khung và thư viện ML được tăng tốc bằng CUDA trong WSL. Điều này bao gồm PyTorch, TensorFlow, Docker và NVIDIA Container Toolkit, giống như bạn làm trên Linux gốc.

Bước 1: Cài đặt trình điều khiển NVIDIA hỗ trợ CUDA cho WSL từ trang web chính thức. Trình điều khiển này được thiết kế đặc biệt để hiển thị GPU trong các bản phân phối. Linux trên WSL.

Bước 2: Bật WSL và thêm bản phân phối dựa trên glibc (Ubuntu/Debian). Cập nhật kernel từ Windows Update và xác minh rằng nó đã được cài đặt. 5.10.43.3 trở lên đang chạy wsl cat /proc/version trong PowerShell.

Bước 3: Làm theo hướng dẫn NVIDIA CUDA trên WSL để cài đặt Toolkit trong bản phân phối và/hoặc cấu hình NVIDIA Docker. Bạn sẽ có thể sử dụng Linux thông thường chảy với tăng tốc và tách biệt hoàn toàn môi trường với Windows chủ.

Tình huống thực tế: máy tính xách tay AMD + NVIDIA hỗn hợp và lỗi với 12.8/11.8

Giả sử Lenovo Ideapad 5 Pro có AMD Ryzen, AMD Radeon iGPU và NVIDIA GeForce GTX dGPU. Khi chạy nvidia-smi xuất hiện Lái xe 526.56 và CUDA Phiên bản 12.0, nhưng việc thử cài đặt CUDA 12.8 hoặc 11.8 có vẻ không hiệu quả.

Chìa khóa để hiểu nó: dòng Phiên bản CUDA của nvidia-smi chỉ ra phiên bản thời gian chạy CUDA tối đa được trình điều khiển của bạn hỗ trợ, không phải Bộ công cụ đã cài đặt. Trình điều khiển 526.56 Nó hỗ trợ CUDA 12.0 và 11.8, nhưng không hỗ trợ 12.8, yêu cầu trình điều khiển mới hơn nhiều (nhánh 55x/56x). Hãy cập nhật lên trình điều khiển mới nhất (Studio hoặc Game Ready DCH) từ trang web NVIDIA và cài đặt lại.

Trên máy tính lai, hãy kiểm tra trong Bảng điều khiển NVIDIA hoặc Cài đặt Đồ họa Windows để đảm bảo ứng dụng máy tính của bạn đang sử dụng GPU NVIDIA. Nếu dGPU không được sử dụng, nvidia-smi Điều này có thể gây ra sự cố hoặc các khung có thể tải trên AMD iGPU, vốn không hỗ trợ CUDA. Hãy cân nhắc cài đặt trình điều khiển mới và kiểm tra xem GeForce Experience có phát hiện được phần cứng hay không.

Yêu cầu đặc biệt: ML.NET Model Builder (chỉ phân loại hình ảnh)

Đối với kịch bản phân loại hình ảnh với Model Builder, Microsoft yêu cầu một ngăn xếp cụ thể: CUDA 10.1 và cuDNN 7.6.4. Hãy cẩn thận vì các phiên bản mới hơn không hỗ trợ luồng cụ thể đó.

Các bước chính với cuDNN 7.6.4: tải xuống ZIP cho CUDA 10.1, giải nén và sao chép cudnn64_7.dll từ cuda\bin a C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin. Bạn không thể có nhiều phiên bản của cuDNN đồng thời; loại bỏ phần còn lại của các phiên bản khác để tránh xung đột trong quá trình thực hiện.

Yêu cầu phần cứng cho kịch bản này: ít nhất một GPU hỗ trợ CUDA và 6 GB bộ nhớ chuyên dụng. Nếu bạn không có GPU cục bộ, Model Builder có thể đào tạo trên các máy ảo GPU. Azurehoặc cuối cùng là trên CPU, mặc dù thời gian đào tạo lâu hơn nhiều.

Chẩn đoán và giải quyết nhanh chóng các vấn đề thường gặp

GPU không xuất hiện trong Cài đặt hoặc Trình quản lý tác vụ: Mở Trình quản lý thiết bị, tìm trong mục Bộ điều hợp màn hình và cài đặt trình điều khiển phù hợp. Không có trình điều khiển. NVIDIAWindows sẽ không cho dGPU tiếp xúc với các ứng dụng.

Kiểm tra phiên bản CUDA của hệ thống: trong PowerShell/CMD chạy nvcc --version. Nếu không thành công, hãy kiểm tra xem Bộ công cụ đã được cài đặt chưa và PATH bao gồm thư mục bin từ Bộ công cụ.

Bộ công cụ không phát hiện được thiết bị CUDA: Hãy đảm bảo trình điều khiển được cập nhật và GPU của bạn nằm trong danh sách hỗ trợ CUDA. thiết bị truy vấn y kiểm tra băng thông Chúng là nhiệt kế để xác nhận rằng ngăn xếp bộ công cụ trình điều khiển phần cứng phản hồi.

Chế độ trình điều khiển không chính xác để tính toán: Trên GPU tính toán, hãy sử dụng nvidia-smi để kiểm tra/chuyển đổi TCC nếu có. Trên hầu hết các máy tính xách tay GeForce, WDDM Đây là chế độ mong muốn và bạn không thể thay đổi nó.

Xung đột phụ thuộc với các framework Python: Nếu bạn đang sử dụng CUDA Wheels qua pip, hãy nhớ rằng chúng chỉ bao gồm thời gian chạy và được gắn với môi trường ảo. Để biên dịch các tiện ích mở rộng hoặc sử dụng các công cụ, hãy cài đặt Bộ công cụ hệ thốnghoặc sử dụng Conda để quản lý mọi thứ một cách tổng thể.

Ví dụ, mẫu và thực hành tốt

Để xác thực hiệu suất và chức năng, hãy biên dịch và chạy deviceQuery y bandwidthTest từ các giải pháp VS trong kho lưu trữ mẫu. Các bản dựng thường để lại các tệp nhị phân trong các đường dẫn như Mẫu CUDA\v13.0\bin\win64\Phát hành nếu bạn giữ nguyên giá trị mặc định.

Để thấy được tiềm năng của CUDA một cách trực quan, hãy chạy các mẫu đồ họa như particles. Ngoài bản demo, họ sẽ giúp bạn lấy tài liệu tham khảo để sử dụng bộ nhớ chia sẻ và các mẫu lưới/khối trong các dự án của riêng bạn.

Các giải pháp thay thế đám mây bằng GPU

Nếu bạn không muốn gặp khó khăn với trình điều khiển cục bộ hoặc cần công suất đỉnh, bạn có thể chọn phiên bản đám mây với GPU hiện đại (A100, RTX 4090, A6000, v.v.). Các dịch vụ này cung cấp triển khai ngay lập tức, mẫu cho PyTorch/TensorFlow và trả tiền khi sử dụng, hữu ích cho việc đào tạo chuyên sâu hoặc thử nghiệm nhanh.

Ghi chú và dấu hiệu

Tài liệu kỹ thuật và các gói của NVIDIA có thể thay đổi mà không cần thông báo trước. Luôn kiểm tra phát hành ghi chú và cập nhật khả năng tương thích trước khi cài đặt trình điều khiển hoặc Bộ công cụ trong quá trình sản xuất.

OpenCL là nhãn hiệu của Apple Inc. được Khronos Group sử dụng theo giấy phép. NVIDIA và logo của NVIDIA là nhãn hiệu hoặc nhãn hiệu đã đăng ký của Tổng công ty NVIDIA ở Hoa Kỳ và các nước khác.

cảm biến độ ẩm
Bài viết liên quan:
Phải làm gì khi cảm biến độ ẩm trên điện thoại di động của chúng tôi được kích hoạt?

Với trình điều khiển phù hợp, bộ công cụ phù hợp và một vài bài kiểm tra được thực hiện tốt, Windows là nền tảng vững chắc cho CUDA: bạn có thể phát triển bằng Visual Studio, xác thực bằng các mẫu chính thức, chạy các khuôn khổ AI trong WSL như trong Linux và nếu gặp sự cố, hãy kéo các trình cài đặt thay thế (Conda/pip) hoặc thậm chí là đám mây để tránh bị treo; điều quan trọng là để căn chỉnh các phiên bản trình điều khiển và bộ công cụ, xác nhận rằng GPU NVIDIA thực sự đang được sử dụng và hỗ trợ bạn trong deviceQuery/kiểm tra băng thông để đảm bảo mọi thứ đều xanh tươi. Chia sẻ hướng dẫn này và nhiều người dùng hơn sẽ biết cách cài đặt CUDA trên Windows.