Chiński model AI DeepSeek postanowił porzucić część swoich planów treningowych opartych na procesorach Huawei Ascend i przestawić etap szkolenia modelu R2 na układy NVIDIA H20.
Decyzja ta, ujawniona w doniesieniach branżowych, oznacza istotny zwrot w strategii technicznej projektu R2 i ma bezpośredni wpływ na tempo jego premiery.
Problemy techniczne – gdzie zawiodło Huawei
Według raportów głównym powodem zmiany były powtarzające się problemy techniczne: niedojrzałe wsparcie softwarowe dla narzędzi CANN od Huawei, ograniczenia przepustowości połączeń między jednostkami obliczeniowymi oraz niestabilne zachowanie podczas pełnych cykli treningowych.
Inżynierowie DeepSeek i wysłane zespoły serwisowe Huawei nie zdołali do tej pory rozwiązać wszystkich błędów, co skutkowało kilkukrotnymi opóźnieniami premiery wersji R2.
Wybór NVIDIA H20 – co to daje i jakie ograniczenia się pojawiają
Przejście na GPU NVIDIA H20 ma przyspieszyć proces treningu dzięki większej dojrzałości ekosystemu oprogramowania i wydajniejszym rozwiązaniom komunikacji między GPU (NVLink/NVSwitch).
Sam H20 jest przedstawiany jako wydajna jednostka z dużą pamięcią HBM i zoptymalizowanymi rdzeniami tensorowymi, co ułatwia trening dużych modeli transformerowych – choć dostępne warianty „na rynek chiński” zawierały też modyfikacje wynikające z ograniczeń eksportowych, które wpływają na ostateczną konfigurację i wydajność.
Aspekty polityczne i presja, która się ujawniła
Sprawa ma również wymiar geopolityczny: media wskazują, że chińskie władze wywierały presję, by firmy krajowe korzystały z rodzimych rozwiązań (czyli np. układów Huawei), co miało wspierać strategię technologicznej samowystarczalności.
Równocześnie praktyczne ograniczenia technologiczne zmusiły DeepSeek do wyboru pragmatycznego – czyli powrotu do rozwiązań NVIDII tam, gdzie to było konieczne do skutecznego treningu. To napięcie między celem politycznym a realiami inżynieryjnymi jest dziś jednym z kluczowych wątków wyścigu AI.
Co to oznacza dla DeepSeek i dla chińskiego ekosystemu AI
Krótkoterminowo przejście na H20 może pozwolić DeepSeek nadrobić opóźnienia i dokończyć trening R2, dając firmie większe szanse konkurencyjne wobec lokalnych i międzynarodowych rywali.
Długofalowo incydent eksponuje jednak luki w dojrzałości krajowych rozwiązań sprzętowych oraz pokazuje, że pełna niezależność technologiczna będzie trudna do osiągnięcia bez dalszych inwestycji w ekosystem oprogramowania i infrastruktury.
Huawei może wciąż pełnić rolę w fazach inferencji (gdzie wymagania są inne), ale scenariusz ten podkreśla konieczność równoległego rozwoju softwaru i narzędzi kompatybilnych z krajowymi chipami.
Konkluzja
Zmiana DeepSeek z Ascend na H20 to sygnał, że nawet ambitne projekty „de-riskujące” zależność od zagranicznych dostawców napotykają realne bariery techniczne.
Decyzje technologiczne w AI przestają być tylko kwestią marketingu lub polityki – stają się raczej konkurencyjnymi koniecznościami operacyjnymi.
Dla branży to przypomnienie: hardware i software muszą dojrzewać razem, jeśli Chiny chcą zbudować naprawdę samodzielny stos AI.