W fali szybkiej iteracji światowej sztucznej inteligencji (Al.), obliczeń wysokiej wydajności (HPC), obliczeń w chmurze i centrów danych, NVIDIA zawsze zajmowała kluczową pozycję.Jego matryca produktów obejmuje podstawowy sprzęt, taki jak jednostki przetwarzania graficznego (GPU) i inteligentne karty interfejsu sieciowego (seria CX), które głęboko napędzają modernizację technologiczną w różnych branżach.NVIDIA ConnectX-7(CX7) orazConnectX-8(CX8), jako przedstawiciele inteligentnych kart sieciowych o wysokiej wydajności, pracują zGrafika graficznabudowanie pełnego rozwiązania typu "power computing + network", które stanie się podstawowym wsparciem dla fabryk sztucznej inteligencji i ośrodków danych na ogromną skalę.ten artykuł wyjaśnia powszechne uprzedzenia poznawcze, głęboko rozkłada podstawowe szczegóły produktu i wartość aplikacji oraz zapewnia dokładne odniesienia dla praktyków informatycznych.
I. Korekta poznawcza: wyjaśnienie powszechnych nieporozumień dotyczącychNVIDIA CX7a takżeCX8
Istnieje wiele nieporozumień poznawczych dotyczących serii NVIDIA CX na rynku: po pierwsze, myląc je z produktami o tej samej nazwie z innych marek (takich jak samochody Mazda CX-7); po drugie,przy założeniu, że CX7 i CX8 obsługują tylko protokoły Ethernet, ale w rzeczywistości oba są kompatybilne z dwustronnymi protokołami InfiniBand i Ethernet;porównując je z zwykłymi kartami sieciowymi i ignorując podstawowe zalety, takie jak przyspieszenie sprzętowe i niskie opóźnieniePo czwarte, uważając, że CX8 jest tylko ulepszeniem przepustowości CX7, ale w rzeczywistości istnieją znaczące różnice między nimi pod względem protokołów, współczynnika efektywności energetycznej,i adaptacyjność scenariusza. Podstawowe poznanie: CX7 i CX8 to wysokiej wydajności inteligentne karty sieciowe / karty super sieciowe koncentrujące się na scenariuszach takich jak centra danych i sztuczna inteligencja, a nie sprzęt konsumenckie.
II. Głębokie demontaż: szczegóły techniczne i podstawowe różnice NVIDIA CX7 i CX8
(I) NVIDIA ConnectX-7 (CX7): Kosztowo efektywny kamień węgielny szybkiego połączenia
Jako inteligentna karta sieciowa czwartej generacji, CX7 jest pozycjonowana dla centrów danych średniej i wysokiej klasy oraz klastrów HPC,z podstawowymi zaletami "wysokiej wydajności + wysokiej kompatybilności + wysokiej efektywności kosztowej"W zakresie sprzętu obsługuje protokoły PCIe Gen4.0/5.0, z szybkością SERDES 16/32GT/s. Konstrukcja pasów x16 jest kompatybilna z PCIe Gen3.0, z maksymalną przepustowością 400 Gb/s, obsługującą podwójne protokoły InfiniBand i Ethernet, i może przełączać tryb RoCE za pomocą narzędzi MLNX_OFED.
Jeśli chodzi o funkcje, ma wbudowany silnik przyspieszenia obliczeniowego sieci NVIDIA, obsługujący ASAP2, GPUDirect i przyspieszenie sprzętowe do szyfrowania i odszyfrowania, zmniejszając zużycie procesora.;specyfikacja fizyczna jest konstrukcją PCIe o połowie wysokości i połowie długości, która ma zastosowanie wyłącznie do serwerów centrów danych i musi spełniać określone warunki zasilania i rozpraszania ciepła.W odniesieniu do zastosowań, jest odpowiedni dla scenariuszy wymagających przepustowości w zakresie 400 Gb/s, takich jak małe i średnie klastry sztucznej inteligencji oraz HPC na poziomie przedsiębiorstw,dostosowanie się do potrzeb, takich jak dopracowywanie modeli sztucznej inteligencji i symulacje przemysłowe.
(II) NVIDIA ConnectX-8 (CX8): Wsparcie podstawowe dla scenariuszy zaawansowanych
Jako produkt iteracyjny CX7, CX8 jest pozycjonowany dla ośrodków danych na ogromną skalę i fabryk sztucznej inteligencji o tryloniach parametrów, koncentrując się na rozwiązywaniu wąskich gardła szybkiego połączenia.W zakresie sprzętu, obsługuje protokół PCIe Gen6, z prędkością transmisji 64GT/s i maksymalną przepustowością 800Gb/s, kompatybilny z InfiniBand i wieloprężnym Ethernet,i dostosowany do nowej generacji procesorów graficznych (H100, Rubin GPU).
Z punktu widzenia funkcji zwiększa możliwość adaptacji do scenariuszy AI/HPC, obsługuje ulepszoną wersję silnika przyspieszenia sieci i jest dostępny w dwóch postaciach: karta pionowa PCIe i karta OCP Spec 3.0,dostosowanie się do złożonego środowiska centrów danych i zgodność z głównymi systemami operacyjnymiW porównaniu z CX7 jego podstawowe różnice to podwojenie przepustowości, uaktualnienie protokołu (wspierający protokół XDR) i zoptymalizowana adaptacja scenariuszy.który może współpracować z platformą Vera Rubin w celu zbudowania pełnej infrastruktury sztucznej inteligencji.
(III) Przewodnik do wyboru CX7 i CX8
Podstawą wyboru jest "scenariusz + budżet": 1. W przypadku małych i średnich klastrów sztucznej inteligencji z wymaganiami przepustowości ≤ 400Gb/s i dążeniem do efektywności kosztowej wybierz CX7; 2.W przypadku fabryk sztucznej inteligencji na bardzo dużą skalę, trillion-parameter model szkolenia z niezwykle wysokimi wymaganiami dotyczącymi przepustowości i niskiego opóźnienia, wybierz CX8; 3. Jeśli istniejący serwer jest PCIe Gen4/5 i nie ma planu modernizacji w krótkim okresie,wybierz CX7; jeśli planujesz wdrożenie nowej generacji procesorów graficznych, wybierz bezpośrednio CX8, aby uniknąć wtórnych ulepszeń.
III. Wysiłki synergistyczne: wartość przemysłowa procesorów graficznych NVIDIA i serii CX
Podstawową konkurencyjnością NVIDIA jest pełnofunkcyjne rozwiązanie "GPU + serii CX + ekosystemu oprogramowania": procesory graficzne stanowią rdzeń mocy obliczeniowej, odpowiedzialne za obliczenia AI i symulację HPC;CX7 i CX8 stanowią rdzeń sieci, rozwiązując wąski gardło transmisji danych między wieloma węzłami, a oba współpracują w celu rozwiązania problemu "silnej mocy obliczeniowej, ale powolnej transmisji".
(I) GPU NVIDIA: podstawowy silnik rewolucji mocy obliczeniowej
GPU NVIDIA przeniknęły z tradycyjnego renderingu graficznego do wielu dziedzin, takich jak sztuczna inteligencja i HPC, z podstawowymi zaletami w zakresie zdolności obliczeniowych równoległych,podzielone na klasę użytkownika (seria GeForce) i klasę centrum danych (H100)H100 obsługuje precyzyjne obliczenia FP8, znacznie poprawiając szybkość szkolenia sztucznej inteligencji; GPU Rubin współpracuje z CPU Vera i CX8 w celu zbudowania superkomputera sztucznej inteligencji,z znacząco zwiększoną efektywnością szkolenia i efektywnością energetyczną wnioskowania.
Rdzeń współpracy między nimi to technologia GPUDirect, która realizuje bezpośrednią transmisję danych między GPU i kartami sieciowymi, pomijając transfer CPU, zmniejszając opóźnienie,i skrócenie cyklu szkolenia dużych modeli sztucznej inteligencji.
(II) Podstawowe zastosowania rozwiązania Full-Stack
1. AI i HPC: CX8 współpracuje z H100 i Rubin GPU w celu wspierania szkolenia modeli o tryloniach parametrów; CX7 i CX8 dostosowują się do wielowęzłowego połączenia superkomputerów,wspieranie zadań takich jak symulacja pogody i sekwencjonowanie genów; 2. obliczenia w chmurze: dostawcy usług w chmurze wdrażają serię CX i procesory graficzne w celu budowy elastycznych platform obliczeniowych, wspierających usługi takie jak wnioskowanie AI i gry w chmurze; 3.W obliczeniach kosmicznych, seria CX jest zintegrowana z procesorami graficznymi w celu uruchomienia modułu Space-1, zapewniając efektywną moc obliczeniową AI; w dziedzinie AI-RAN,Obie firmy współpracują w celu przekształcenia stacji bazowych 5G w platformy edge AI.; 4. Przemysł i przemysł motoryzacyjny: wspieranie inteligentnej produkcji, symulacji przemysłowej oraz badań i rozwoju oraz wdrażania autonomicznej jazdy na poziomie L4.
IV. Trendy w branży i sugestie dla praktyków
W przyszłości seria CX będzie iterowała w kierunku większej przepustowości i niższej opóźnienia (np. CX9 może osiągnąć 1,6 Tb/s),i GPU wzmocnią zdolności obliczeniowe równoległe i współczynniki efektywności energetycznej, i być głęboko zintegrowane z procesorami i LPU.
Sugestie dla praktyków: po pierwsze, dokładny wybór produktów zgodnie z przepustowością, budżetem i kompatybilnością sprzętu; po drugie, przywiązanie wagi do optymalizacji współpracy,dopasowanie odpowiednich kart sieciowych CX przy wdrażaniu klastrów GPUPo trzecie, należy zwrócić uwagę na iterację technologiczną, nadążyć za dynamiką nowych produktów, takich jak konferencje GTC, oraz zoptymalizować architekturę techniczną.
Wniosek: NVIDIA CX7, CX8 i GPU są podstawowym sprzętem centrów danych i przemysłu AI, a ich iteracja technologiczna napędza cyfrową transformację różnych gałęzi przemysłu.Posiadanie właściwości technicznych i logiki wyboru pomoże praktykom sprostać wyzwaniom technicznym i wykorzystać możliwości przemysłowe.