Siêu máy tính để bàn tốt nhất cho AI

  • DGX Spark mang 1 petaFLOPS và bộ xử lý AI lên máy tính để bàn với tính năng bảo mật tại chỗ.
  • Châu Âu đang tiến lên với EuroHPC (MareNostrum 5, Leonardo, LUMI) và các trung tâm như HPC‑6 và ALPES.
  • Hoa Kỳ, Trung Quốc, Nhật Bản và Ấn Độ dẫn đầu về exascale với Aurora, El Capitan và Tianhe-3.
  • Hệ sinh thái kết hợp HPC lớn và các nhóm địa phương để phát triển, tinh chỉnh và suy luận.

Siêu máy tính

Ranh giới giữa PC và trung tâm dữ liệu đang nhanh chóng mờ đi và cùng với đó là sự ra đời của một danh mục mới: siêu máy tính để bàn dành cho AIBước nhảy vọt này không chỉ dân chủ hóa khả năng tiếp cận với điện toán khổng lồ mà còn thay đổi cách chúng ta tạo nguyên mẫu, đào tạo và suy ra các mô hình tiên tiến mà không phải lúc nào cũng phụ thuộc vào đám mây.

Song song với đó, hành tinh này đang trải qua một cuộc chạy đua thực sự để đạt tới exascale, từ cơ sở hạ tầng quốc gia hàng trăm megawatt đến những chiếc máy tính nhỏ gọn có khả năng đạt đến petaFLOPS trong văn phòng của một nhà nghiên cứu. Trong bài viết này, chúng tôi tập hợp tất cả dữ liệu quan trọng từ các nguồn được tham khảo tại một nơi: tổng quan toàn cầu, các công ty hàng đầu châu Âu và châu Á, danh sách lịch sử, các trung tâm hàng đầu, và dĩ nhiên, ngôi sao máy tính để bàn mới, Nvidia DGX Spark.

Siêu máy tính là gì và tại sao nó lại quan trọng trong AI?

Un siêu máy tính Đây là một hệ thống có khả năng tính toán vượt trội hơn nhiều so với một máy tính cá nhân thông thường. Hiệu suất của nó được thể hiện bằng FLOPS (số phép tính dấu chấm động mỗi giây), với các đơn vị như petaFLOPS (1015) và, trong giới tinh hoa hiện tại, exaFLOPS (1018).

Chúng hoạt động như một tập hợp hàng ngàn nút (mỗi nút có CPU, GPU chuyên dụng, bộ nhớ và lưu trữ) được kết nối bởi mạng và thiết bị chuyển mạch tốc độ cao, để hoạt động như một máy tính duy nhất. Trong khi một máy tính để bàn mạnh mẽ có thể chạy hàng chục TFLOPS, những hệ thống này có thể đạt tới hàng trăm PFLOPS hoặc hơn.

Ứng dụng của nó bao gồm hầu hết mọi thứ: dự báo thời tiết, vật lý thiên văn, y sinh, thiết kế thuốc, mô phỏng hạt nhân, địa vật lý, phát triển bền vững và nghiên cứu AI. Nhờ khả năng tính toán khổng lồ, chúng có thể xử lý hàng tỷ điểm dữ liệu chỉ trong vài giây và giải quyết các vấn đề mà thiết bị truyền thống phải mất nhiều năm mới giải quyết được.

  • Công dụng nổi bật: vũ khí và an ninh quốc gia, ngành công nghiệp dược phẩm, dữ liệu lớn, tin sinh học, khí hậu và chất lượng không khí, mô phỏng kỹ thuật, thành phố thông minh, giáo dục và điện toán đám mây.

Do kích thước và mức tiêu thụ của chúng, chúng yêu cầu làm mát tiên tiến (thường là chất lỏng), các phòng riêng biệt được kiểm soát nhiệt độ và phòng cháy chữa cháy. Thậm chí còn có những trung tâm tái sử dụng nhiệt lượng tạo ra, như các cơ sở Thụy Sĩ sưởi ấm các tòa nhà đại học.

Châu Âu tăng tốc: EuroHPC, InvestAI và các hệ thống lớn

Siêu máy tính châu Âu và EuroHPC

Châu Âu có 162 siêu máy tính được đăng ký vào năm 2025 và có kế hoạch xây dựng các cơ sở mới. EU cũng đã thúc đẩy khoản đầu tư 200.000 tỷ euro theo sáng kiến ​​InvestAI để trở thành quốc gia dẫn đầu toàn cầu về trí tuệ nhân tạo.

Việc điều phối và tài trợ cho máy tính cao cấp thuộc về "Liên doanh Châu Âu về Điện toán Hiệu suất Cao» (EuroHPC JU), đơn vị tài trợ và vận hành mạng lưới 9 hệ thống trải rộng khắp lục địa. Trong số đó có LUMI (Phần Lan), Leonardo (Ý) và MareNostrum 5 (Tây Ban Nha), những trụ cột của Chủ quyền kỹ thuật số châu Âu.

Tây Ban Nha đóng góp Trung tâm siêu máy tính Barcelona (BSC-CNS), vào năm 2004 đã xây dựng MareNostrum 1 lịch sử và trình làng MareNostrum 5 vào tháng 12 năm 2023. Sau này, với 314 PFLOPS tối đaBộ xử lý Intel Xeon và mức tiêu thụ 4.158,90 kW sẽ chiếm vị trí thứ 11 trong TOP500 vào năm 2025 và hướng tới AI, nghiên cứu y tế, phát hiện thuốc và khí tượng học.

Ý tỏa sáng với Leonardo (Cineca + EuroHPC), được lắp đặt vào năm 2022 tại Bologna. Hệ thống kết hợp công nghệ AMD và Intel, tiêu thụ 7.493,74 kW và đạt 315,74 PFLOPS và được xếp hạng thứ 9 trên toàn thế giới. Đây là chìa khóa để các trường đại học và công ty cạnh tranh toàn cầu trong lĩnh vực y sinh, năng lượng, khí hậu và trên hết là AI.

Phần Lan là chủ nhà PHÒNG (CSC + EuroHPC), được cung cấp bởi AMD và HPE. Dự án được khai trương vào năm 2023 tại Kajaani và dự kiến ​​sẽ đạt 386 PFLOPS, tiêu thụ 7.106,82 kW và giữ vị trí thứ 8 trên toàn thế giới. Trong EuroHPC, đây là một trong những thành trì mạnh mẽ nhất.

Song song đó, Thụy Sĩ vận hành siêu máy tính tại CSCS DÃY ALPS/DÃY ALPS 5, với mức tiêu thụ 7.124,00 kW và 434,90 PFLOPS xếp hạng thứ 7 trên thế giới. Nó tập trung vào khí tượng, AI, y sinh và năng lượngvà là một phần của chương trình gồm 13 dự án trong đó ALPES là dự án tiêu biểu nhất.

Ngành năng lượng cũng đang thúc đẩy: ENI (Ý) đã ra mắt vào năm 2024 HPC-6 với AMD và HPE, đạt được 606,97 PFLOPS với mức tiêu thụ 8.460,90 kW. Nhà máy được kết nối với Trung tâm Dữ liệu Xanh của ENI để đẩy nhanh quá trình chuyển đổi năng lượng và xếp hạng thứ 5 trên toàn thế giới.

Châu Á và Châu Mỹ: exascale, hồ sơ và hệ thống bóng tối

Nhật Bản duy trì biểu tượng của sự xuất sắc với Fugaku (RIKEN R-CCS, Kobe). Dựa trên kiến ​​trúc Fujitsu A64FX và ARM, nó đạt được 442 PFLOPS với 26.248,36 kW và tiếp tục là chuẩn mực về hiệu quả của nó, đến mức dẫn đầu Green500 Theo các nguồn tin được tham khảo, nó áp dụng cho y học, khí hậu, AI và hiệu quả năng lượng.

Nga, bất chấp các lệnh trừng phạt, đã triển khai vào năm 2023 MSU-270 tại Đại học Tổng hợp Quốc gia Lomonosov (Moscow). Hệ thống này tích hợp khoảng 100 bộ tăng tốc đồ họa tiên tiến (chưa rõ là của AMD hay Intel) và ước tính 400 PFLOPS, được tích hợp vào mạng lưới các trung tâm AI, vật lý, hóa học, toán học và y học của Nga.

Trung Quốc kết hợp sự thận trọng và sức mạnh. Loạt phim Sunway (Wuxi) ra đời năm 2016 với TaihuLight (125 PFLOPS) và phát triển thành OceanLight vào năm 2021, được coi là exascale (>1 exaFLOPS), mặc dù không có số liệu chính thức do căng thẳng công nghệ với Hoa Kỳ. Trong năm 2024/2025, Thiên Hà-3 (Xingyi) Trong các cuộc thử nghiệm, nó có thể đạt được từ 1,57 đến 2,01 exaFLOPS, với tin đồn rằng có thể vượt qua El Capitan.

Hoa Kỳ tham gia vào "giải đấu lớn" với một số mô hình exascale. Rạng đông (ANL + DOE), được thiết kế để đạt 1,9–2 exaFLOPS, được lắp đặt vào năm 2023 và đạt đỉnh vào năm 2024; hiện nay nó đứng thứ 3 trong TOP500 và phục vụ khoa học, y học, khí hậu, AI, vật lý thiên văn và vật lý hạt. Song song đó, Đội trưởng (LLNL + NNSA) đặt mục tiêu đạt 2–2,8 exaFLOPS, dẫn đầu TOP500 và sẽ dành riêng cho an ninh quốc gia, với các ứng dụng trong mô phỏng hạt nhân, an ninh mạng, chăm sóc sức khỏe, biến đổi khí hậu và vật lý thiên văn.

Ngoài danh sách công khai, còn có các sáng kiến ​​AI cụ thể ở cấp quốc gia. Tại Vũ Hán, China Telecom vận hành Trung tâm máy tính thông minh trung ương, được xây dựng bằng phần cứng và phần mềm trong nước cùng với hệ thống làm mát bằng chất lỏng, nhằm mục đích đào tạo các mô hình khổng lồ; một số nguồn thậm chí còn chỉ ra 5 exaFLOPS, mặc dù chưa có xác nhận chính thức.

Ấn Độ đang chuyển mình: GPU, đám mây và chân trời exascale

Ấn Độ không muốn bị bỏ lại phía sau. Sáng kiến Năng lực tính toán AI của Ấn Độ (thuộc Sứ mệnh IndiaAI) đã cam kết đầu tư khoảng 1.240 tỷ đô la vào năm 2024 cho một siêu máy tính mới với ít nhất 10.000 GPU dành cho AI, hợp tác với Nvidia. Ngoài ra, Microsoft công bố 3.000 tỷ đô la vào tháng 1 năm 2025 cho cơ sở hạ tầng đám mây và AI trong nước.

Hệ sinh thái địa phương đang nóng lên: Bhavish Aggarwal (Giám đốc điều hành của Ola) đã đầu tư 230 triệu đô la vào Krutrim-2 LLM. Có 34 siêu máy tínhvà C-DAC đang thúc đẩy, cùng với Sứ mệnh siêu máy tính quốc gia (NSM), một mạng lưới quốc gia có thể cung cấp hệ thống exascale đầu tiên của Ấn Độ trong khoảng thời gian từ năm 2025 đến năm 2026. Người ta dự định xây dựng hơn 70 siêu máy tính trong những năm tiếp theo

Colossus, siêu máy tính xAI và tranh cãi về năng lượng

Ở Hoa Kỳ, xAI (Elon Musk) triển khai Colossus tại Memphis chỉ trong 122 ngày vào năm 2024. Nó bắt đầu với 100.000 GPU Nvidia và dự kiến ​​200.000, nhắm đến Grok 3.0 AI và các phiên bản tương lai. Trong các bài kiểm tra điểm chuẩn, nó sẽ đạt 10,6 exaFLOPS của AI, một con số có thể đưa quốc gia này vào danh sách những quốc gia hùng mạnh nhất hành tinh.

Không phải mọi thứ đều là tiếng vỗ tay: việc sử dụng khí đốt tự nhiên như một nguồn năng lượng đã bị chỉ trích vì tác động đến chất lượng không khí địa phương. Tuy nhiên, dự án này minh họa tốc độ mà khu vực tư nhân có thể xây dựng cơ sở hạ tầng tập trung vào AI đẳng cấp thế giới.

DGX Spark: "Siêu máy tính để bàn" mang AI tiên tiến về nhà

Nvidia đã đặt ra tiêu chuẩn cao với Tia lửa DGX, một hệ thống nhỏ gọn được tạp chí TIME trao giải là một trong những "Phát minh tốt nhất năm 2025" và có sẵn để mua rộng rãi bắt đầu từ ngày 15 tháng 10. Trái tim của nó là Grace Blackwell GB10, có khả năng đạt tới 1 petaFLOPS, với mạng ConnectX-7 và toàn bộ phần mềm Nvidia AI để các nhà nghiên cứu và công ty khởi nghiệp có thể sử dụng "cắm và chạy".

Ở cấp độ phần cứng, Spark kết hợp một CPU ARM 20 lõi (10 Cortex-X925 + 10 Cortex-A725), Bộ nhớ GPU hợp nhất LPDDR5x 128GB, SSD M.2 NVMe tự mã hóa 4TB, 4x USB-C, HDMI, WiFi 7, Bluetooth 5.4, LAN 10GbE và Hệ thống Hệ điều hành DGX. Nó được thiết kế cho AI tác nhân, lý luận và tải trọng phức tạp hiện đại.

Nvidia khẳng định rằng họ có thể mô hình phù hợp với tối đa 70.000 tỷ tham số, chạy suy luận cục bộ và lưu trữ dữ liệu nhạy cảm tại chỗ mà không cần dựa vào đám mây. Các báo cáo khác cho thấy nó có thể xử lý LLM lên đến 200.000 tỷ thông số tùy thuộc vào cấu hình và kiểu máy, nhấn mạnh tham vọng trở thành một “trung tâm dữ liệu mini” trên máy tính để bàn.

Về mặt chức năng, khả năng liên kết hai tia lửa trong một cụm nhỏ để tạo ra một "đám mây cá nhân". Việc tích hợp rất dễ dàng: mạng có dây và không dây, thiết bị ngoại vi Bluetooth và ngăn xếp CUDA/cuDNN, Triton và công ty triển khai Nguyên mẫu tác nhân, tinh chỉnh, suy luận biệt lập và bảo mật dữ liệu.

Giá khởi điểm được đặt ở mức Đô la Mỹ 3.999và các thương hiệu lớn như Acer, Asus, Dell, Gigabyte, HP, Lenovo và MSI sẽ là các biến thể tiếp thị. Quan trọng: đây không phải là một chiếc PC Windows thông thường; nó là một siêu máy tính cục bộ cho AI tương thích với các mô hình của DeepSeek, AI của Trung QuốcMeta, Nvidia, Google và Qwen, cùng nhiều ứng dụng nguồn mở khác. Ngay cả Elon Musk cũng đã nhận được thiết bị của mình từ Jensen Huang.

Sự ra đời của Spark trùng hợp với sự thay đổi về các ưu tiên: theo các nhà lãnh đạo ngành, Người dùng và doanh nghiệp sẽ tìm kiếm các hệ thống hỗ trợ làn sóng sạc thông minh tiếp theo.Bạn có thể đặt hàng tại Nvidia.com và thông qua các đối tác và nhà phân phối được ủy quyền.

Máy tính cá nhân và máy trạm AI: Khi bạn cần phần cứng chuyên dụng

Siêu máy tính để bàn tốt nhất cho AI

Nếu bạn định đào tạo người mẫu hoặc phát triển, bạn nên đầu tư vào phần cứng chuyên dụng; nếu bạn chỉ sử dụng AI, một đội cân bằng có thể đủ hoặc phải dùng đến Các trường hợp EC2 trong đám mây.

Ngoài ra, còn có những đội ngũ mang AI mạnh mẽ đến thị trường nội địa mà không cần dựa vào đám mây, như chúng ta đã thấy với Spark. Và nếu bạn còn băn khoăn về lựa chọn này, một số đội ngũ cung cấp hỗ trợ cá nhân hóa: IbericaVIP hứa sẽ tư vấn cho bạn lựa chọn máy tính lý tưởng cho các dự án AI của bạn.

Cộng đồng và tin tức: không phải mọi thứ bạn đọc đều chính thức

Trên Internet có rất nhiều diễn đàn và subreddit tập trung vào Nvidia, nơi mọi người thảo luận về trình điều khiển, GPU và tin đồn. Lưu ý: Những cộng đồng này được quản lý bởi người hâm mộ và không đại diện cho Nvidia trừ khi được nêu rõ. Bạn nên lưu ý điều này khi đánh giá các thông tin rò rỉ hoặc số liệu chưa được xác nhận.

Bên trong trông như thế nào: kiến ​​trúc, quy mô và làm mát

Một siêu máy tính về cơ bản là một tập hợp hàng ngàn máy tính được liên kết bởi mạng có độ trễ thấp, băng thông caoMỗi nút tích hợp CPU, GPU, RAM và bộ nhớ; hệ thống tăng thêm sức mạnh thông qua phần mềm và thư viện được tối ưu hóa.

Đơn vị đo lường thống trị là FLOPS: chúng ta đã đi từ TFLOPS trên máy tính cá nhân tại nhà đến PFLOPS và exaFLOPS trong HPC. Do đó, 1 TFLOPS = 1012 FLOPS và 1 PFLOPS = 1015Siêu máy tính chiếm toàn bộ căn phòng và được nhiều nhóm sử dụng cùng lúc, với nguồn tài nguyên thường xuyên đạt đến giới hạn.

Làm mát là rất quan trọng. Có những CPU và GPU vượt quá 80 ºC, đó là lý do tại sao nước nóng hoặc nước lỏng, bộ trao đổi nhiệt và thiết kế tùy chỉnh được sử dụng. Một số công trình áp dụng các giải pháp sáng tạo, chẳng hạn như tái sử dụng nhiệt để sưởi ấm các tòa nhà.

Họ ở đâu và làm thế nào để đến thăm họ

Có hơn một nghìn siêu máy tính trên thế giới. Trung Quốc và Hoa Kỳ dẫn đầu về số lượng và sức mạnh, với dữ liệu lịch sử như 226 hệ thống của Trung Quốc nằm trong số 500 hệ thống mạnh nhất. Tuy nhiên, Hoa Kỳ đã tích lũy được tổng số PFLOPS (644) nhiều hơn Trung Quốc (565) trong một số phiên bản.

Tại Tây Ban Nha, MareNostrum của BSC-CNS (Barcelona) là mạnh nhất cả nước. Các phiên bản đầu tiên của nó được đặt trong tủ kính với hệ thống chữa cháy phun sương siêu nhỏ và một địa điểm độc đáo: nhà nguyện tại Cơ sở Bắc UPC. Có sẵn các chuyến tham quan ảo và đôi khi có hướng dẫn viên.

Các tài liệu lịch sử đã ghi nhận sự ra đời và hoạt động của Mare Nostrum 5 giữa năm 2020 và 2021; cuối cùng nó đã được giới thiệu vào cuối năm 2023 với sự gia tăng hiệu suất đã đề cập ở trên. Sự phát triển này minh họa rõ ràng cách lịch trong HPC chịu sự điều chỉnh do tính phức tạp về mặt kỹ thuật.

Danh sách lịch sử và các hệ thống đặc trưng khác

Danh sách TOP500 Nó đã tồn tại từ năm 1993 và được cập nhật hai lần một năm. Ví dụ, năm 2021, top 10 bao gồm Fugaku, Summit, Sierra, Sunway TaihuLight, Perlmutter, Selene, Tianhe-2A, Juwels Booster Module, HPC5 và Frontera. Mặc dù một số đã bị vượt qua, nhưng chúng vẫn còn đó. các cột mốc công nghệ vì tác động của nó.

Một số dữ liệu liên quan bổ sung từ các hệ thống được trích dẫn trong các nguồn: Frontier (HPE Cray EX, ORNL) là công ty đầu tiên chính thức phá vỡ kỷ lục exascale; Hội nghị thượng đỉnh (IBM POWER9 + Nvidia V100) xuất sắc trong lĩnh vực bệnh Alzheimer, di truyền học và khí tượng học; Dãy núi (IBM + Nvidia + Mellanox) làm việc cho NNSA về an ninh hạt nhân.

Ở Châu Âu, ngoài những nơi đã đề cập, còn có Juwels Booster y Siêu MUC (Lenovo, làm mát bằng nước trực tiếp), với hàng chục petabyte và môi trường trực quan hóa mạnh mẽ. Thụy Sĩ vận hành Piz (Cray), với DataWarp làm bộ đệm bùng nổ để tăng tốc I/O.

Ý được thành lập HPC5 (Dell, trên ENI) với Xeon Gold 6252 và Nvidia V100; Marconi-100 (IBM POWER9 + Volta V100) tại Cineca; và lời cầu xin (Phòng thí nghiệm Berkeley, Hoa Kỳ) là một trong những phòng thí nghiệm mạnh nhất xử lý AI với 6.000 GPU A100, có khả năng thực hiện 180 PFLOPS và trong một số tình huống AI, có thể thực hiện được một số exaFLOPS hiệu quả.

Ở Hoa Kỳ, Selene (Nvidia, A100) nổi bật về hiệu suất (1.344 kW); Frontera (Dell, Đại học Texas) nổi bật với khả năng lưu trữ (ổ cứng HDD 50 PB + ổ SSD 3 PB, 12 Tbps) và khởi động lại trong 17 giây; Thiên Chúa Ba Ngôi (Cray XC40) phục vụ NNSA với Haswell và Knights Landing; Để lại (IBM Power9) đã củng cố hệ sinh thái LLNL.

Nhật Bản cũng thúc đẩy ABCI (Fujitsu) cho AI trên nền tảng đám mây. Và ở Tây Ban Nha, Mare Nostrum 4 (2017) đạt 13,7 PFLOPS trước khi chuyển sang MN5, với các ứng dụng trong di truyền học, hóa học, cổ sinh vật học, khí tượng học hoặc chất lượng không khí (CALIOPE).

Toàn bộ bản đồ này, từ các cài đặt exascale đến máy tính để bàn, vẽ nên một tương lai gần trong đó Việc thử nghiệm, điều chỉnh và suy luận các mô hình tiên tiến sẽ ngày càng mang tính cục bộ, với sự bổ sung của điện toán đám mây. Châu Âu đang tăng tốc với EuroHPC, Hoa Kỳ và Trung Quốc đang nắm giữ nhịp độ exascale, Ấn Độ đang nổi lên với những khoản đầu tư khổng lồ, và về mặt máy tính để bàn, DGX Spark đang mở ra một cánh cửa hữu hình đến với AI cấp cao mà không cần rời khỏi phòng thí nghiệm, văn phòng, hay thậm chí là nhà riêng.

Microsoft Azure là gì?
Bài viết liên quan:
Microsoft Azure: Nó là gì, nó hoạt động như thế nào và tất cả các sản phẩm và dịch vụ của nó