Alibaba je uzvratila udarac konkurentskom DeepSeeku iznenadnim lansiranjem svog novog modela Qwen 2.5-Max. Kineski e-commerce gigant tvrdi da njezin najnoviji proizvod u području umjetničke inteligencije nadmašuje sposobnosti DeepSeekova nedavno lansiranog i mnogo hvaljenog modela DeepSeek-V3.
Vrijeme debija Qwen 2.5-Max neuobičajeno je, s obzirom na to da je lansiran prvog dana kineske lunarne nove godine, kada su mnogi kineski radnici na odmoru. To pokazuje koliko je DeepSeekov AI proboj uzdrmao etablirane igrače.
Vidjeli smo učinak koji je DeepSeekov proboj imao na strane konkurente poput OpenAI-a, što je dovelo do brojnih objava na X-u od strane CEO-a Sama Altmana i ogromnog pada dionica Nvidije od 600 milijardi dolara – najveći jednodnevni pad za bilo koju javnu kompaniju ikad.
deepseek's r1 is an impressive model, particularly around what they're able to deliver for the price.
— Sam Altman (@sama) January 28, 2025
we will obviously deliver much better models and also it's legit invigorating to have a new competitor! we will pull up some releases.
Nije iznenađujuće da je DeepSeekov uspjeh potaknuo i moćne domaće kineske tehnološke gigante da požure s odgovorom. Alibaba je uzvratila s novim Qwen 2.5-Max modelom.
„Qwen 2.5-Max nadmašuje… gotovo u svim aspektima GPT-4o, DeepSeek-V3 i LLaMa-3.1-405B“, pohvalila se Alibaba Cloud u svojoj WeChat objavi, spominjući neke od najnaprednijih open-source AI modela poput OpenAI-a i Mete.

Osim općih AI sposobnosti DeepSeek-a, još jedan faktor koji je pridonio njegovoj popularnosti bile su izuzetno niske cijene razvoja i pokretanja njegovih modela. To je čak dovelo investitore da ozbiljno preispitaju ogromne iznose koje američki tehnološki lideri troše na AI.
Vjerojatno imajući to na umu, Alibaba Cloud je također naglasila učinkovitost Qwen 2.5-Max modela u blogu, ističući da je treniran na više od 20 trilijuna tokena, koristeći arhitekturu mješavine stručnjaka (MoE) koja zahtijeva znatno manje računalnih resursa nego uobičajeni pristupi.
Osim Alibabe, matična kompanija TikToka, ByteDance, odgovorila je ažuriranom verzijom svog vodećeg AI modela, za koji tvrdi da je nadmašio OpenAI-ov GPT-3.5 u određenim benchmark testovima.
Ranija verzija DeepSeek-a također je izazvala intenzivan rat cijena u Kini još u svibnju. Nevjerojatno niska cijena DeepSeek-V2 modela od samo 1 yuana (14 centi) po milijun tokena podataka prisilila je velike pružatelje cloud usluga poput Alibabe da smanje cijene svojih AI modela do 97%.
Vrijedno je spomenuti da, poput DeepSeek-a, i Alibaba novi Qwen 2.5-Max izbjegava raspravu o osjetljivim političkim temama vezanim uz Kinu. Pokušaji postavljanja takvih pitanja obično završavaju porukama o prekoračenju kvota podataka, dok odgovara normalno na druga pitanja.