5 Minuty
ARM zaprezentował dziś Lumex – gotowy do produkcji podsystem obliczeniowy (CSS), opracowany z myślą o procesach 3nm i stworzony, aby przyspieszyć budowę wysokowydajnych, energooszczędnych mobilnych układów SoC przez partnerów z branży półprzewodników. Lumex nie przekształca ARM w producenta chipów, lecz oferuje gotowe do wdrożenia, elastyczne rozwiązania układowe, które mogą służyć jako modułowe bloki konstrukcyjne. Tym samym umożliwia partnerom skupienie zasobów inżynieryjnych na wyróżnieniu klastrów CPU i GPU.
Czym jest Lumex CSS?
Lumex to modułowy projekt chipsetu dedykowany nowoczesnym smartfonom, urządzeniom wearables i innym sprzętom edge. Zawiera najnowsze rdzenie CPU ARM, rodzinę GPU Mali-G1, skalowalną magistralę systemową oraz pamięci z myślą o bezpieczeństwie, przygotowane pod wiele typów foundry 3nm. Celem jest przyspieszenie cyklu projektowania, zapewnienie spójnej wydajności niezależnie od fabryki oraz udostępnienie zaawansowanych funkcji, takich jak bezpieczna wirtualizacja i efektywna pamięć systemowa, szerokiemu gronu producentów OEM.
Kluczowe elementy sprzętowe
- Skalowalne klastry CPU z nowym C1-DSU (Design System Unit): obsługa od 1 do 14 rdzeni oraz do trzech typów rdzeni wybieranych spośród czterech opcji C1.
- Rodzina GPU Mali-G1: skalowalność od 1 do 24 rdzeni shader, w tym wariant high-end Mali-G1 Ultra.
- System Interconnect L1 & SLC: systemowa pamięć podręczna znacząco ograniczająca przecieki energii (nawet o 71% względem standardowych pamięci RAM), co obniża pobór mocy w stanie spoczynku.
- MMU L1: jednostka zarządzania pamięcią zoptymalizowana pod kątem bezpiecznej i ekonomicznej wirtualizacji – umożliwia korzystanie z wielu systemów operacyjnych i podział zadań w jednym SoC.

Oferta CPU i poziomy wydajności
Rdzenie serii C1 ARM obejmują pełen zakres zastosowań: od flagowej, najwyższej wydajności po ultraoszczędne wearables. Przykładowe warianty i ich zastosowania:
- C1-Ultra — Flagowa wydajność jednordzeniowa (+25% wzrost rok do roku oraz dwucyfrowy wzrost IPC). Doskonały do wnioskowania na dużych modelach AI, fotografii obliczeniowej, tworzenia treści i generatywnych zadań AI.
- C1-Premium — Zbliżona szczytowa wydajność do C1-Ultra przy o 35% mniejszym rozmiarze rdzenia. Idealny dla zaawansowanych urządzeń średniej klasy, multitaskingu czy asystentów głosowych always-on.
- C1-Pro — Wyważona efektywność i wzrost wydajności o 16% przy długotrwałym obciążeniu. Stworzony do odtwarzania wideo, inference podczas streamowania i nieprzerwanych zadań w tle.
- C1-Nano — Bardzo energooszczędny, kompaktowy rdzeń, oferujący do 26% większą wydajność w najmniejszych urządzeniach typu wearables oraz IoT.
GPU, akceleracja AI i operacji macierzowych
Rodzina GPU Mali-G1 jest skalowalna pod różne segmenty rynku. ARM deklaruje, że Mali-G1 Ultra zapewnia o ok. 20% lepszą wydajność rastrowania i do 2x szybszy ray tracing w porównaniu do Immortalis-G925. W zadaniach inference GPU G1 osiąga ok. 20% lepszy wynik względem poprzedniej generacji.

Sercem rozwoju SI w ARM jest Scalable Matrix Extension 2 (SME2). SME2 przyspiesza obliczenia macierzowe kluczowe dla nowoczesnych sieci neuronowych – według ARM rozwiązanie to oferuje do 5x większą przepustowość ML po stronie CPU, przy nawet 3x lepszej efektywności energetycznej niż starsze konstrukcje. Pozwala to na uruchamianie wydajnych modeli bezpośrednio na urządzeniu.
Efektywność energetyczna i bezpieczeństwo na poziomie platformy
Lumex skupia się na projektowaniu podsystemów o niskim zapotrzebowaniu na energię. Interconnect L1 i systemowa pamięć podręczna (SLC) znacząco ograniczają straty prądu w trybie czuwania – co przekłada się na dłuższą żywotność baterii. MMU L1 dostarcza mechanizmy sprzętowe dla bezpiecznej wirtualizacji, pozwalając producentom na podział sprzętu na wiele systemów lub izolację wrażliwych zadań z niższymi narzutami niż rozwiązania programowe.

Wydajność, porównania i deklaracje
Zestaw CPU C1 ARM przewyższa poprzednie rdzenie średnio o 30% w sześciu branżowych testach. Rzeczywiste korzyści zależą od obciążenia: gry i streaming zyskują ok. 15%, natomiast codzienne zadania (odtwarzanie wideo, przeglądanie, social media) – średnio ok. 12% większą efektywność. W porównaniu z Cortex-X925, C1-Ultra oferuje dwucyfrową poprawę IPC, co potwierdza trend ARM w kierunku lepszej wydajności jednordzeniowej i SI.
Zastosowania i znaczenie rynkowe
Lumex powstał z myślą o szerokim spektrum urządzeń: od flagowych smartfonów wymagających maksymalnej wydajności i zaawansowanych algorytmów AI na urządzeniu, przez średniopółkowe telefony korzystające z efektywnych rdzeni premium, aż po tablety i sprzęt streamingowy o wydłużonym czasie pracy oraz kompaktowe wearables wymagające ekstremalnej oszczędności energii. Dla OEM-ów i partnerów ARM Lumex to szybsze wprowadzenie produktu na rynek, jednolitość implementacji 3nm oraz prostsza integracja zaawansowanej AI z zachowaniem dobrej wydajności i kontroli temperatury.
Reakcje branży
Kilka firm partnerskich ARM powitało Lumex jako strategiczny bodziec rozwoju. Główni producenci OEM i zespoły projektowe zaznaczyli, że gotowy, elastyczny podsystem obliczeniowy eliminuje większość skomplikowanej integracji sprzętowej, pozwalając skupić się na wyróżnikach produktu – jak przetwarzanie obrazu, funkcje SI czy optymalizacja zużycia energii. Główni dostawcy platform zauważają również, że SME2 wesprze wdrożenie zaawansowanych modeli na szerszą gamę urządzeń, skracając opóźnienia i zwiększając prywatność poprzez inference lokalne.
Podsumowanie
Lumex to wyraźna zmiana w sposobie oferowania własności intelektualnej ARM na erę 3nm – nie poprzez produkcję chipów, a dostarczanie kompleksowej, personalizowalnej i gotowej do wdrożenia bazy, przyspieszającej cykle projektowe oraz standaryzującej kluczowe funkcje, takie jak bezpieczna wirtualizacja czy akceleracja macierzowa. Dla producentów koncentrujących się na SI, grafice i energooszczędnej mocy obliczeniowej, Lumex stanowi pragmatyczną drogę do układów mobilnych kolejnej generacji.
Źródło: gsmarena

Komentarze