Microsoft upozorava – držite vaše kartice dalje od AI-a!

Microsoft je predstavio zanimljiv eksperiment koji zvuči kao da je stigao iz bliske budućnosti: Magentic Marketplace, simulirano tržište na kojem se umjetni agenti međusobno natječu, kupuju, prodaju i – potencijalno – troše vaš novac. Ispod svega leži jedno ključno pitanje: biste li stvarno povjerili AI-u broj svoje kartice?

U svijetu u kojem OpenAI, Anthropic i drugi razvijaju asistente koji mogu kupovati online, rezervirati hotele i voditi računa o svakodnevnim zadacima, Microsoft je želio vidjeti što bi se dogodilo kada bi takvi agenti međusobno poslovali – bez izravnog ljudskog nadzora.

U eksperimentu su korišteni modeli poput GPT-4o, Gemini-2.5-Flash i nekoliko open-source alternativa. Ispod haube, Magentic Marketplace upravlja katalozima proizvoda i usluga, simulira plaćanja i omogućuje komunikaciju između „kupaca“ i „prodavača“ – sve to u virtualnom okruženju sa 100 digitalnih kupaca i 300 digitalnih tvrtki.

Rezultati su, blago rečeno, bili mješoviti.
AI agenti su pokazali da mogu pomoći u pronalasku opcija i pregovaranju, ali što su imali više izbora, to su donosili lošije odluke. Umjesto da detaljno uspoređuju ponude, većina se odlučila za prvo što im se učinilo „dovoljno dobro“. Samo su najnoviji modeli, poput GPT-5 i Gemini-2.5-Flash, pokazali veću razinu „upornosti“ u pretrazi.

Ipak, najveći problem nije bila lijenost, nego ranjivost. Kada su istraživači uveli lažne recenzije, izmišljene nagrade ili „prompt injection“ napade (kojima se AI-u suptilno sugerira da plati pogrešnoj strani), neki su modeli vrlo lako pali na trikove. Gemini-2.5-Flash se pokazao najotpornijim, ali ni on nije bio savršen. Zaključak istraživača bio je jasan: „agentni sustavi su ranjivi i zahtijevaju ozbiljan nadzor“.

Drugim riječima, tehnologija je fascinantna, ali još nije spremna da samostalno vodi vaše financije. Microsoftovi stručnjaci priznaju da su trenutačni testovi ograničeni jer su provedeni u „statičkom tržištu“, dok bi stvarni svijet bio mnogo dinamičniji – s korisnicima i agentima koji uče i prilagođavaju se tijekom vremena.

Dok AI polako ulazi u sve pore digitalne ekonomije, istraživanja poput ovog pokazuju koliko je još dugačak put do stvarnog povjerenja. Ili, kako su to saželi Microsoftovi istraživači: „Agenti bi trebali pomagati, a ne zamjenjivati ljudsko odlučivanje.“

Drugim riječima – neka vaš AI još malo pričeka prije nego što mu date broj kartice.

IZVOR

Svi korisnici koji žele koristiti ili prenositi sadržaj s Bajtbox portala moraju se pridržavati sljedećih pravila: Citiranje Izvora: Obavezno je jasno i precizno navesti izvor informacija, uključujući naziv autora (ako dostupno), naslov članka ili teksta te datum objave. Poveznica na Originalni Tekst: Svaka upotreba sadržaja mora uključivati aktivnu poveznicu (link) koja vodi na izvorni tekst na Bajtbox portalu. Pravna Odgovornost: Kršenje ovih pravila može imati pravne posljedice sukladno zakonima o autorskim pravima.

guest

0 Comments
Inline Feedbacks
Pogledaj sve komentare
0
Pogledaj komentare ili komentirajx