Nauka

DeepSeek z Chin wyzwala rewolucję w branży AI. Jakie zagrożenie stawia konkurencji?

2025-01-28

Autor: Piotr

20 stycznia chińska firma DeepSeek zaprezentowała światu nowy model sztucznej inteligencji o nazwie DeepSeek R1. Tydzień później wstrząsnęła amerykańskim rynkiem giełdowym, powodując spadek akcji Nvidii, wiodącego producenta procesorów wykorzystywanych w technologii AI, o ponad 17%. Straty na rynku wyniosły rekordowe 600 miliardów dolarów, co wzbudziło ogromne obawy wśród inwestorów.

Interesujące jest to, że DeepSeek zaprezentowała swoją pierwszą wersję dużego modelu językowego jeszcze w 2023 roku, co potwierdza, że firma od jakiegoś czasu zyskuje na znaczeniu w konkurencji z amerykańskimi gigantami w dziedzinie sztucznej inteligencji.

Co więcej, DeepSeek udostępnia swoje modele na licencji MIT, co oznacza, że mogą być one swobodnie wykorzystywane, modyfikowane i rozpowszechniane. Firma publikuje również szczegółowe raporty techniczne dotyczące procesu treningu modeli, co czyni ją znacznie bardziej transparentną w porównaniu do takich konkurentów jak OpenAI, Google czy Anthropic, którzy często nie ujawniają szczegółów technicznych.

Reakcja rynku była emocjonalna

Dlaczego jednak DeepSeek wywołał tak dramatyczny wstrząs? Model R1 osiąga wyniki w testach – w tym matematycznych i programistycznych – które są porównywalne do najnowszej wersji ChatGPT. Co jednak szokuje, to koszt jego treningu, który wyniósł jedynie 5,6 miliona dolarów w ciągu zaledwie dwóch miesięcy. Dla porównania, budżety treningowe amerykańskich firm sięgają od 100 milionów do nawet 1 miliarda dolarów.

DeepSeek zastosował tylko 2048 połączonych ze sobą procesorów Nvidia, podczas gdy rywale zazwyczaj korzystają z dziesiątek tysięcy takich chipów. To właśnie ta innowacja wzbudziła obawy inwestorów, ponieważ może sugerować, że zapotrzebowanie na produkty Nvidii może w przyszłości ulec zmniejszeniu.

Niektórzy eksperci uważają, że reakcja rynku była przesadzona. Choć DeepSeek rzeczywiście zademonstrowało nowatorskie podejście, wciąż korzysta z procesorów Nvidii. Poza tym większa efektywność AI może doprowadzić do wzrostu zapotrzebowania na moc obliczeniową, gdyż tańsze i bardziej wydajne modele AI mogą być coraz szerzej adoptowane przez firmy.

Zaintrygowani sukcesem DeepSeek?

Sukces DeepSeek nie oznacza jednak chińskiej dominacji w świecie AI. R1 to bardziej efekt usprawnienia istniejących rozwiązań. Eksperci podkreślają, że modele takie jak Google Gemini 2.0 Flash Thinking oferują lepsze wyniki przy niższych kosztach. Dodatkowo, OpenAI szykuje się do wypuszczenia nowego modelu o3, który ma oferować jeszcze potężniejsze możliwości w kontekście „rozumienia”.

Kluczowe czynniki sukcesu DeepSeek obejmują doświadczenie zdobyte przy tworzeniu wcześniejszych wersji modelu oraz zespół informatyków o wielkim doświadczeniu. DeepSeek został założony przez Lianga Wenfenga, który zarządza funduszem inwestycyjnym wartym 8 miliardów dolarów. Firma efektywnie wykorzystywała AI do prognozowania cen akcji, co wymagało umiejętności optymalizacji mocy obliczeniowej.

Kolejnym ważnym aspektem było zastosowanie techniki uczenia przez wzmacnianie, która jest kluczowa w osiąganiu najbardziej zaawansowanych wyników w AI. Ta metoda pozwala systemom na samodzielne odkrywanie strategii rozwiązywania problemów poprzez próby i błędy, co jest o wiele bardziej zaawansowane niż tradycyjne uczenie się przez naśladowanie.

W miarę jak DeepSeek zdobywa popularność, z niecierpliwością czekamy na odpowiedzi ze strony tradycyjnych graczy w branży AI. Co przyniesie przyszłość tej ekscytującej i dynamicznie rozwijającej się dziedzinie?