4 Minuty
Dyrektor generalny NVIDIA, Jensen Huang, potwierdził, że firma aktywnie przygotowuje swoją nową generację architektury AI, Rubin, w zakładach TSMC. Rubin, traktowany wewnętrznie jako przełom w dziedzinie obliczeń, to całkowicie przeprojektowany od podstaw stos centrów danych NVIDIA – od pamięci i węzła technologicznego po pakowanie i połączenia. Huang ujawnił, że NVIDIA już zakończyła tape-out sześciu układów Rubin, które obecnie są produkowane próbnie w fabrykach TSMC.
Co ogłosił Jensen Huang
Podczas wizyty na Tajwanie Huang przekazał lokalnym mediom, że Rubin jest „bardzo zaawansowany” i że sześć różnych układów Rubin zostało już wysłanych do TSMC. Wśród nich znajdują się nowe jądra CPU i GPU oraz wyspecjalizowane układy do skalowania i komunikacji. Ogłoszenie to oznacza szeroką modernizację platformy, a nie jedynie kosmetyczną aktualizację.
Układy potwierdzone w tape-oucie
- Dedykowany układ CPU
- Nowej generacji GPU (przewidywana rodzina R100)
- Switch NVLink do skalowania przepustowości w konfiguracjach multi-GPU
- Procesor fotoniki krzemowej do optycznego I/O
- Dodatkowe układy interposer/bridge wspierające integrację chipletów
- Układy logiczne do pakowania oraz przełączania
Funkcje techniczne i innowacje
Architektura Rubin niesie ze sobą szereg przełomowych usprawnień dla obliczeń AI. NVIDIA planuje wykorzystać pamięć HBM4 do zasilania układów R100 GPU, co stanowi znaczący krok naprzód względem obecnej generacji HBM3E. Projekt oparty jest na zaawansowanym procesie N3P o klasie 3nm od TSMC oraz technologiach pakowania CoWoS-L. Kluczowe jest wdrożenie architektury chipletowej – to nowość na taką skalę w historii NVIDIA – oraz przejście na układ 4x reticle w porównaniu do ~3,3x reticle architektury Blackwell, co umożliwia większy łączny obszar układów i modularne skalowanie. Wbudowanie procesora fotoniki krzemowej oraz przełącznika NVLink podkreśla nacisk na ogromną przepustowość i niskie opóźnienia w połączeniach dla rozproszonych obciążeń AI.
Porównania: Rubin vs Blackwell i Hopper
Podczas gdy Blackwell Ultra (GB300) symbolizuje szczyt możliwości obecnego harmonogramu NVIDIA, Rubin ma być prawdziwym skokiem generacyjnym, podobnym do tego, który wcześniej zapewnił Hopper. Przejście Rubina na chipletową architekturę, HBM4, proces N3P oraz pakowanie CoWoS-L sugeruje poprawę wydajności, efektywności energetycznej i możliwości skalowania zarówno dla funkcji treningowych, jak i inferencyjnych. Zmiany te mają znacznie szerszy wymiar niż jedynie odświeżenie procesu – obejmują architekturę pamięci, fizyczne pakowanie oraz topologię połączeń.

Zalety i zastosowania
Rubin został zoptymalizowany z myślą o trenowaniu największych modeli AI, pracy z ogromnymi modelami językowymi oraz wysokowydajnych obliczeniach, gdzie przepustowość pamięci oraz komunikacja między węzłami są kluczowymi ograniczeniami. Fotonika krzemowa i rozbudowany przełącznik NVLink sprawiają, że Rubin staje się idealnym rozwiązaniem dla hyperskalerów oraz klastrów AI w przedsiębiorstwach, które wymagają wydajnej i gęstej sieci o niskich opóźnieniach. Chipletowa architektura może także poprawić uzyskiwalność i skrócić czas wprowadzania na rynek różnych wariantów, przeznaczonych do treningu, inferencji i rozwiązań serwerowych na brzegu sieci.
Znaczenie rynkowe i harmonogram
Biorąc pod uwagę już przeprowadzone tape-outy i rozpoczęcie próbnej produkcji w TSMC, komercyjna premiera Rubina przewidziana jest wstępnie na lata 2026–2027, w zależności od kwalifikacji i uzysków produkcyjnych. Dla dostawców chmury, producentów OEM oraz firm budujących infrastrukturę AI, Rubin stanowi strategiczny punkt przełomowy: może ustanowić nowe standardy wydajności na rynku serwerów AI i zainicjować kolejne cykle modernizacji sprzętu w centrach danych.
Podsumowanie
NVIDIA Rubin jawi się jako przełomowa architektura: łączy pamięć HBM4, proces TSMC 3nm, modularność chipletów, pakowanie CoWoS-L oraz optyczne wejścia/wyjścia, dostarczając platformę nowej generacji dla AI i HPC. Ponieważ sześć tape-outów trafiło już do TSMC, branża z zainteresowaniem śledzi kolejne etapy próbnej produkcji w perspektywie premiery planowanej na lata 2026–2027.
Źródło: wccftech

Komentarze