PROCESOR

NVIDIA Grace CPU​

Przełomowy procesor dla nowoczesnego centrum danych.

Przegląd

Zaprojektowany, aby sprostać potrzebom wydajności i efektywności nowoczesnych centrów danych AI

Procesor NVIDIA Grace™ został stworzony dla nowego typu centrum danych — takie, które przetwarza ogromne ilości danych w celu uzyskania inteligencji przy maksymalnej efektywności energetycznej. Te centra obsługują różnorodne obciążenia, takie jak AI, analityka danych, aplikacje w chmurze hiperskalowej oraz obliczenia wysokiej wydajności (HPC). Aby sprostać najbardziej wymagającym potrzebom, Grace oferuje 2 razy większą wydajność na wat, 2 razy większą gęstość pakowania oraz najwyższą przepustowość pamięci w porównaniu do dzisiejszych czołowych serwerów.


Grace łączy 72 rdzenie Arm® Neoverse™ V2 o wysokiej wydajności i efektywności energetycznej, połączone z NVIDIA Scalable Coherency Fabric (SCF), które zapewnia 3,2 TB/s przepustowości dwukierunkowej — dwukrotnie większej od tradycyjnych CPU — co gwarantuje maksymalną wydajność przy zachowaniu pełnej kompatybilności z ekosystemem Arm. Ponadto, Grace to pierwszy CPU centrum danych z pamięcią LPDDR5X klasy serwerowej, która zapewnia do 500 GB/s przepustowości w szerokim podsystemie pamięci, zużywając przy tym jedną piątą energii tradycyjnej pamięci DDR przy podobnych kosztach.

Zasoby

Poznaj procesor NVIDIA Grace

NVIDIA Grace CPU Superchip

Procesor NVIDIA Grace Superchip składa się z dwóch chipów CPU Grace, które są połączone koherentnie za pomocą NVIDIA NVLink™ Chip-to-Chip (C2C) z prędkością 900 GB/s. W jednym module mieści 144 rdzenie Neoverse V2, z pamięcią LPDDR5X klasy serwerowej, zapewniającą do 1 TB/s przepustowości pamięci. NVIDIA Grace CPU Superchip stanowi serce dwuprocesorowego serwera w kompaktowym module, oferując dwukrotnie wyższą wydajność przy tej samej mocy co tradycyjne CPU serwerowe z pamięcią DDR5.

Przeczytaj kartę kat​​alo​​gową 

Przeczytaj bi​​ałą księgę 

NVIDIA Grace CPU C1

NVIDIA Grace C1 to jednostronowa, wysokowydajna platforma serwerowa zoptymalizowana pod kątem skalowalnych i brzegowych platform, w tym chmury hiperskalowej, CDN, przechowywania, telekomunikacji i innych wysokowydajnych platform brzegowych, która nie kompromituje wydajności ani przepustowości. Ta platforma zapewnia wysoką wydajność na poziomie x86, z możliwością konfiguracji od 140W do 250W dla procesora Grace i pamięci LPDDR5X, w porównaniu do ponad 400W dla podobnych platform x86. Zaprojektowana przez NVIDIA skalowalna struktura koherencji umożliwia procesorowi Grace osiągnięcie dwukrotnie wyższej efektywności energetycznej w porównaniu do wiodących platform x86.

Przeczytaj kartę katalogową 

Najważniejsze informacje

Podwójna wydajność centrum danych lub połowa zużycia energii z procesorem Grace

Analiza grafów

3x

więcej
w porównaniu do CPU x86

Analiza danych

2x

więcej
w porównaniu do CPU x86

Pogoda

2x

więcej
w porównaniu do CPU x86

Mikrousługi

1,6x

więcej
w porównaniu do CPU x86

NVIDIA Grace Superchip 480GB LPDDR5X, AMD EPYC 9654 768GB DDR5. OS: Ubuntu 22.04. Kompilatory: GCC 12.3, chyba że zaznaczono inaczej. Zasilanie dla efektywności energetycznej obejmuje moc CPU + pamięć, mierzony pobór energii; Analiza grafów: Suite Benchmarków Gap BFS arXiv:1508.03619 [cs.DC], 2015. Analiza danych: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4); Pogoda: ICON QUBICC 80 km rozdzielczości, NVHPC 24.5 (Grace), ICC 2021.4 (x86); Mikrousługi: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f, N instancji w równoległym uruchomieniu)

Analiza grafów

Procesor NVIDIA Grace Superchip łączy rdzenie Arm Neoverse V2 za pomocą niestandardowej sieci NVIDIA Scaled Coherency, która zapewnia niezwykle wysoką wydajność dla obciążeń takich jak GapBS Breadth First Search, które mocno obciążają komunikację i synchronizację między rdzeniami. NVIDIA Grace oferuje ponad dwukrotnie lepszą wydajność na poziomie serwera oraz trzykrotnie lepszą efektywność energetyczną w porównaniu do czołowych systemów x86.

Analiza danych

W miarę jak ilość danych rośnie, firmy muszą maksymalizować czerpanie wiedzy z tych danych, aby utrzymać konkurencyjność. Zestaw HiBench testuje klasteryzację K-means w kontekście odkrywania wiedzy i eksploracji danych, korzystając z wysokiej przepustowości i niskiego zużycia energii pamięci w procesorze NVIDIA Grace. Procesor Grace jest ponad dwukrotnie bardziej energooszczędny w porównaniu do wiodących procesorów x86 dostępnych na rynku.

Pogoda

Modele prognozowania pogody stanowią ważne zastosowanie obliczeń wysokowydajnych (HPC) i są kluczowe dla rozumienia oraz reagowania na zmieniające się wzorce pogodowe w związku ze zmianami klimatycznymi. Pamięć LPDDR5X o wysokiej przepustowości i efektywności energetycznej, z przepustowością do 500 GB/s przy poborze energii około 16W, umożliwia procesorowi Grace wykonanie prawie dwukrotnie większej ilości pracy w tym samym zakresie mocy w porównaniu do istniejących rozwiązań x86.

Mikrousługi

Mikrousługi to zbiór małych, niezależnych usług, które umożliwiają centrom danych łatwe skalowanie w celu sprostania popytowi. Oferują również elastyczność w zarządzaniu poszczególnymi usługami bez wpływu na całą aplikację. Google Protobufs mierzy, jak szybko system może serializować i odczytywać dane potrzebne do wymiany informacji między systemami, co jest kluczowe dla działania mikrousług. Wysoka wydajność i efektywność energetyczna procesora NVIDIA Grace zapewniają czołową wydajność i oszczędność energii, maksymalizując przepustowość centrum danych.

Cechy

Przełomy Technologiczne

Rdzenie Neoverse V2 Arm

Na centrum danych obecnie najbardziej wydajne rdzenie Arm Neoverse V2, zoptymalizowane pod kątem najlepszej wydajności na rdzeń i niesamowitej efektywności w porównaniu do tradycyjnych CPU. Grace integruje 72 rdzenie i, w połączeniu z pamięcią LPDDR5X oraz siecią NVIDIA Scaled Coherency Fabric, zapewnia dwukrotnie lepszą wydajność w tym samym zakresie mocy w porównaniu do wiodących serwerów x86.

NVIDIA Scalable Coherency Fabric

NVIDIA SCF to architektura mesh i rozproszonej pamięci podręcznej zaprojektowana przez NVIDIA do skalowania rdzeni i przepustowości w sposób energooszczędny i zajmujący niewiele miejsca. SCF oferuje ponad 3,2 TB/s łącznej przepustowości bisection, co jest dwukrotnie wyższe od tradycyjnych CPU, zapewniając płynny przepływ danych między rdzeniami CPU, pamięcią i I/O systemowym. Redukuje wąskie gardła w aplikacjach obciążonych przesyłem dużych ilości danych, takich jak analityka grafowa, gdzie NVIDIA Grace osiąga nawet 2 razy lepszą wydajność w porównaniu do wiodących serwerów x86.

Pamięć LPDDR5X

NVIDIA Grace jako pierwszy procesor serwerowy wykorzystuje pamięć LPDDR5X z wysoką niezawodnością na poziomie serwerowym, zapewnianą mechanizmami takimi jak ECC. Pamięć LPDDR5X zbalansowana jest pod względem kosztu, mocy, przepustowości i pojemności, osiągając do 500 GB/s przy zaledwie 16 W — czyli około jednej piątej mocy tradycyjnej pamięci DDR5.

System single i dual socket

Portfolio NVIDIA Grace obejmuje Superchip Grace, stanowiący rdzeń serwera z dwoma gniazdami, wyposażony w 144 rdzenie Neoverse V2 oraz do 960 GB pamięci LPDDR5X w jednym kompaktowym module, wymagającym tylko 500 W dla CPU i pamięci. Dla większej elastyczności, CPU Grace C1 zapewnia znakomitą wydajność z 72 rdzeniami Neoverse V2, połączonymi najszybszą siecią NVIDIA Scalable Coherency, w konfiguracji jednogniazdowej, zoptymalizowanej pod kątem chmur, przechowywania, edge i telco, oferując do 2x lepszą wydajność na W w porównaniu do konwencjonalnych serwerów x86.

Aktualności

Dowiedz się więcej o Grace Blackwell

NVIDIA Grace CPU zapewnia światową klasę wydajności centrum danych i przełomową efektywność energetyczną

NVIDIA zaprojektowało procesor NVIDIA Grace jako nowy rodzaj CPU o wysokiej wydajności dla centrum danych — stworzony, aby zapewnić przełomową efektywność energetyczną i zoptymalizowany pod kątem wydajności na skalę centrum danych.

Przeczytaj blog techniczny

NVIDIA Grace CPU integruje się z ekosystemem oprogramowania ARM

W obliczu rosnących ograniczeń energetycznych centrów danych niezwykle ważne jest przyspieszanie jak największej liczby obciążeń i uruchamianie pozostałych na najbardziej wydajnym możliwym sprzęcie obliczeniowym. Procesor Grace jest zoptymalizowany do obsługi zarówno przyspieszonych, jak i CPU-only zadań, zapewniając do 2 razy lepszą wydajność przy tym samym zużyciu energii w porównaniu do konwencjonalnych CPU.

​​Przeczytaj blog techniczny 

Wyróżnienie: Petrobras przyspiesza rozwiązywanie równań liniowych dla symulacji zbiorników wodnych z NVIDIA Grace CPU

Ten blog pokazuje, jak procesor NVIDIA Grace wyróżnia się w rozwiązywaniu układów równań liniowych w tym przepływie pracy, osiągając do 4,5 razy szybszy czas rozwiązania, 4,3 razy wyższą efektywność energetyczną i 1,5 raza wyższą skalowalność w porównaniu do alternatywnych CPU opartych na x86.

Przeczytaj bl​​og techniczny 

Specyfikacje

Grace CPU


NVIDIA Grace CPU C1

NVIDIA Grace CPU Superchip

Konfiguracja1x CPU Grace2x CPU Grace
Liczba rdzeni72 rdzenie Arm Neoverse V2 z 4x 128b SVE2144 rdzenie Arm Neoverse V2 z 4x 128b SVE2
Pamięć L164 KB i-cache + 64 KB d-cache na rdzeń64 KB i-cache + 64 KB d-cache na rdzeń
Pamięć L21 MB na rdzeń1 MB na rdzeń
Pamięć L3114 MB228 MB
Wielkość pamięci LPDDR5XOpcje pamięci na module: 120 GB, 240 GB i 480 GBOpcje pamięci: 240 GB, 480 GB i 960 GB
Przepustowość pamięciDo 384 GB/s dla 480 GBDo 512 GB/s dla 120 GB, 240 GB
Przepustowość NVLink-C2CNie dotyczyDo 900 GB/s
Łącza PCIeDo 4x PCIe Gen 5x16 z opcją rozdzielenia (bifurcation)Do 8x PCIe Gen 5x16 z opcją rozdzielenia (bifurcation)

Gotowy, aby zacząć?

Porozmawiaj z naszym ekspertem produktowym NVIDIA, aby dowiedzieć się więcej o procesorze NVIDIA Grace CPU​

Skontaktuj się z nami