Przegląd
Zaprojektowany, aby sprostać potrzebom wydajności i efektywności nowoczesnych centrów danych AI
Procesor NVIDIA Grace™ został stworzony dla nowego typu centrum danych — takie, które przetwarza ogromne ilości danych w celu uzyskania inteligencji przy maksymalnej efektywności energetycznej. Te centra obsługują różnorodne obciążenia, takie jak AI, analityka danych, aplikacje w chmurze hiperskalowej oraz obliczenia wysokiej wydajności (HPC). Aby sprostać najbardziej wymagającym potrzebom, Grace oferuje 2 razy większą wydajność na wat, 2 razy większą gęstość pakowania oraz najwyższą przepustowość pamięci w porównaniu do dzisiejszych czołowych serwerów.
Grace łączy 72 rdzenie Arm® Neoverse™ V2 o wysokiej wydajności i efektywności energetycznej, połączone z NVIDIA Scalable Coherency Fabric (SCF), które zapewnia 3,2 TB/s przepustowości dwukierunkowej — dwukrotnie większej od tradycyjnych CPU — co gwarantuje maksymalną wydajność przy zachowaniu pełnej kompatybilności z ekosystemem Arm. Ponadto, Grace to pierwszy CPU centrum danych z pamięcią LPDDR5X klasy serwerowej, która zapewnia do 500 GB/s przepustowości w szerokim podsystemie pamięci, zużywając przy tym jedną piątą energii tradycyjnej pamięci DDR przy podobnych kosztach.
Zasoby
Poznaj procesor NVIDIA Grace

NVIDIA Grace CPU Superchip
Procesor NVIDIA Grace Superchip składa się z dwóch chipów CPU Grace, które są połączone koherentnie za pomocą NVIDIA NVLink™ Chip-to-Chip (C2C) z prędkością 900 GB/s. W jednym module mieści 144 rdzenie Neoverse V2, z pamięcią LPDDR5X klasy serwerowej, zapewniającą do 1 TB/s przepustowości pamięci. NVIDIA Grace CPU Superchip stanowi serce dwuprocesorowego serwera w kompaktowym module, oferując dwukrotnie wyższą wydajność przy tej samej mocy co tradycyjne CPU serwerowe z pamięcią DDR5.

NVIDIA Grace CPU C1
NVIDIA Grace C1 to jednostronowa, wysokowydajna platforma serwerowa zoptymalizowana pod kątem skalowalnych i brzegowych platform, w tym chmury hiperskalowej, CDN, przechowywania, telekomunikacji i innych wysokowydajnych platform brzegowych, która nie kompromituje wydajności ani przepustowości. Ta platforma zapewnia wysoką wydajność na poziomie x86, z możliwością konfiguracji od 140W do 250W dla procesora Grace i pamięci LPDDR5X, w porównaniu do ponad 400W dla podobnych platform x86. Zaprojektowana przez NVIDIA skalowalna struktura koherencji umożliwia procesorowi Grace osiągnięcie dwukrotnie wyższej efektywności energetycznej w porównaniu do wiodących platform x86.
Najważniejsze informacje
Podwójna wydajność centrum danych lub połowa zużycia energii z procesorem Grace
Analiza grafów
3x
więcej
w porównaniu do CPU x86
Analiza danych
2x
więcej
w porównaniu do CPU x86
Pogoda
2x
więcej
w porównaniu do CPU x86
Mikrousługi
1,6x
więcej
w porównaniu do CPU x86
NVIDIA Grace Superchip 480GB LPDDR5X, AMD EPYC 9654 768GB DDR5. OS: Ubuntu 22.04. Kompilatory: GCC 12.3, chyba że zaznaczono inaczej. Zasilanie dla efektywności energetycznej obejmuje moc CPU + pamięć, mierzony pobór energii; Analiza grafów: Suite Benchmarków Gap BFS arXiv:1508.03619 [cs.DC], 2015. Analiza danych: HiBench + K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4); Pogoda: ICON QUBICC 80 km rozdzielczości, NVHPC 24.5 (Grace), ICC 2021.4 (x86); Mikrousługi: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f, N instancji w równoległym uruchomieniu)
Analiza grafów
Procesor NVIDIA Grace Superchip łączy rdzenie Arm Neoverse V2 za pomocą niestandardowej sieci NVIDIA Scaled Coherency, która zapewnia niezwykle wysoką wydajność dla obciążeń takich jak GapBS Breadth First Search, które mocno obciążają komunikację i synchronizację między rdzeniami. NVIDIA Grace oferuje ponad dwukrotnie lepszą wydajność na poziomie serwera oraz trzykrotnie lepszą efektywność energetyczną w porównaniu do czołowych systemów x86.
Analiza danych
W miarę jak ilość danych rośnie, firmy muszą maksymalizować czerpanie wiedzy z tych danych, aby utrzymać konkurencyjność. Zestaw HiBench testuje klasteryzację K-means w kontekście odkrywania wiedzy i eksploracji danych, korzystając z wysokiej przepustowości i niskiego zużycia energii pamięci w procesorze NVIDIA Grace. Procesor Grace jest ponad dwukrotnie bardziej energooszczędny w porównaniu do wiodących procesorów x86 dostępnych na rynku.
Pogoda
Modele prognozowania pogody stanowią ważne zastosowanie obliczeń wysokowydajnych (HPC) i są kluczowe dla rozumienia oraz reagowania na zmieniające się wzorce pogodowe w związku ze zmianami klimatycznymi. Pamięć LPDDR5X o wysokiej przepustowości i efektywności energetycznej, z przepustowością do 500 GB/s przy poborze energii około 16W, umożliwia procesorowi Grace wykonanie prawie dwukrotnie większej ilości pracy w tym samym zakresie mocy w porównaniu do istniejących rozwiązań x86.
Mikrousługi
Mikrousługi to zbiór małych, niezależnych usług, które umożliwiają centrom danych łatwe skalowanie w celu sprostania popytowi. Oferują również elastyczność w zarządzaniu poszczególnymi usługami bez wpływu na całą aplikację. Google Protobufs mierzy, jak szybko system może serializować i odczytywać dane potrzebne do wymiany informacji między systemami, co jest kluczowe dla działania mikrousług. Wysoka wydajność i efektywność energetyczna procesora NVIDIA Grace zapewniają czołową wydajność i oszczędność energii, maksymalizując przepustowość centrum danych.
Cechy
Przełomy Technologiczne
Rdzenie Neoverse V2 Arm
Na centrum danych obecnie najbardziej wydajne rdzenie Arm Neoverse V2, zoptymalizowane pod kątem najlepszej wydajności na rdzeń i niesamowitej efektywności w porównaniu do tradycyjnych CPU. Grace integruje 72 rdzenie i, w połączeniu z pamięcią LPDDR5X oraz siecią NVIDIA Scaled Coherency Fabric, zapewnia dwukrotnie lepszą wydajność w tym samym zakresie mocy w porównaniu do wiodących serwerów x86.
NVIDIA Scalable Coherency Fabric
NVIDIA SCF to architektura mesh i rozproszonej pamięci podręcznej zaprojektowana przez NVIDIA do skalowania rdzeni i przepustowości w sposób energooszczędny i zajmujący niewiele miejsca. SCF oferuje ponad 3,2 TB/s łącznej przepustowości bisection, co jest dwukrotnie wyższe od tradycyjnych CPU, zapewniając płynny przepływ danych między rdzeniami CPU, pamięcią i I/O systemowym. Redukuje wąskie gardła w aplikacjach obciążonych przesyłem dużych ilości danych, takich jak analityka grafowa, gdzie NVIDIA Grace osiąga nawet 2 razy lepszą wydajność w porównaniu do wiodących serwerów x86.
Pamięć LPDDR5X
NVIDIA Grace jako pierwszy procesor serwerowy wykorzystuje pamięć LPDDR5X z wysoką niezawodnością na poziomie serwerowym, zapewnianą mechanizmami takimi jak ECC. Pamięć LPDDR5X zbalansowana jest pod względem kosztu, mocy, przepustowości i pojemności, osiągając do 500 GB/s przy zaledwie 16 W — czyli około jednej piątej mocy tradycyjnej pamięci DDR5.
System single i dual socket
Portfolio NVIDIA Grace obejmuje Superchip Grace, stanowiący rdzeń serwera z dwoma gniazdami, wyposażony w 144 rdzenie Neoverse V2 oraz do 960 GB pamięci LPDDR5X w jednym kompaktowym module, wymagającym tylko 500 W dla CPU i pamięci. Dla większej elastyczności, CPU Grace C1 zapewnia znakomitą wydajność z 72 rdzeniami Neoverse V2, połączonymi najszybszą siecią NVIDIA Scalable Coherency, w konfiguracji jednogniazdowej, zoptymalizowanej pod kątem chmur, przechowywania, edge i telco, oferując do 2x lepszą wydajność na W w porównaniu do konwencjonalnych serwerów x86.
Aktualności
Dowiedz się więcej o Grace Blackwell

NVIDIA Grace CPU zapewnia światową klasę wydajności centrum danych i przełomową efektywność energetyczną
NVIDIA zaprojektowało procesor NVIDIA Grace jako nowy rodzaj CPU o wysokiej wydajności dla centrum danych — stworzony, aby zapewnić przełomową efektywność energetyczną i zoptymalizowany pod kątem wydajności na skalę centrum danych.

NVIDIA Grace CPU integruje się z ekosystemem oprogramowania ARM
W obliczu rosnących ograniczeń energetycznych centrów danych niezwykle ważne jest przyspieszanie jak największej liczby obciążeń i uruchamianie pozostałych na najbardziej wydajnym możliwym sprzęcie obliczeniowym. Procesor Grace jest zoptymalizowany do obsługi zarówno przyspieszonych, jak i CPU-only zadań, zapewniając do 2 razy lepszą wydajność przy tym samym zużyciu energii w porównaniu do konwencjonalnych CPU.

Wyróżnienie: Petrobras przyspiesza rozwiązywanie równań liniowych dla symulacji zbiorników wodnych z NVIDIA Grace CPU
Ten blog pokazuje, jak procesor NVIDIA Grace wyróżnia się w rozwiązywaniu układów równań liniowych w tym przepływie pracy, osiągając do 4,5 razy szybszy czas rozwiązania, 4,3 razy wyższą efektywność energetyczną i 1,5 raza wyższą skalowalność w porównaniu do alternatywnych CPU opartych na x86.
Grace CPU
NVIDIA Grace CPU C1 | NVIDIA Grace CPU Superchip | |
Konfiguracja | 1x CPU Grace | 2x CPU Grace |
Liczba rdzeni | 72 rdzenie Arm Neoverse V2 z 4x 128b SVE2 | 144 rdzenie Arm Neoverse V2 z 4x 128b SVE2 |
Pamięć L1 | 64 KB i-cache + 64 KB d-cache na rdzeń | 64 KB i-cache + 64 KB d-cache na rdzeń |
Pamięć L2 | 1 MB na rdzeń | 1 MB na rdzeń |
Pamięć L3 | 114 MB | 228 MB |
Wielkość pamięci LPDDR5X | Opcje pamięci na module: 120 GB, 240 GB i 480 GB | Opcje pamięci: 240 GB, 480 GB i 960 GB |
Przepustowość pamięci | Do 384 GB/s dla 480 GB | Do 512 GB/s dla 120 GB, 240 GB |
Przepustowość NVLink-C2C | Nie dotyczy | Do 900 GB/s |
Łącza PCIe | Do 4x PCIe Gen 5x16 z opcją rozdzielenia (bifurcation) | Do 8x PCIe Gen 5x16 z opcją rozdzielenia (bifurcation) |
Gotowy, aby zacząć?
Porozmawiaj z naszym ekspertem produktowym NVIDIA, aby dowiedzieć się więcej o procesorze NVIDIA Grace CPU