Googleova značajka Gemini Live može razgovarati s korisnicima, ali teško da se može nazvati poticajnim sugovornikom. Unatoč tome, Google želi da korisnici barem zamisle Gemini Live kao pravog suputnika. Kako AI modeli postaju sve napredniji, najnovija ažuriranja za Gemini nastoje ostaviti dojam da AI zapravo poziva korisnika na telefon umjesto da se radi o interakciji s oblakom.
Prošlog tjedna Google je ažurirao svoj model Gemini 2.0 Flash i učinio ga dostupnim svim korisnicima aplikacije Gemini, bez potrebe za plaćanjem pretplate. Među tim promjenama pojavila se i jedna skrivena nadogradnja, koju je otkrio 9to5Google – obavijesti Gemini Live sada izgledaju mnogo prirodnije i humanije.
Ranije, kada bi korisnik izašao iz Gemini Live na Androidu dok je aplikacija radila u pozadini, prikazivala se jednostavna obavijest s opcijom “Završi Live način rada”. U novoj verziji aplikacije, Gemini Live sada izgleda kao dolazni poziv, s opcijama “Prekini poziv” ili “Stavi na čekanje”. Ako se aplikacija koristi s zaključanog ekrana, prikazuje se obavijest “Uživo s Geminijem” uz napomenu da AI “sluša”.
Iako se radi o maloj promjeni, ona jasno pokazuje kako Google namjerava pozicionirati svoj AI u 2025. godini. Gemini Live sada može razgovarati s korisnicima, a nedavno je dobio i mogućnost razumijevanja prenesenog foto i video sadržaja. U budućnosti, Google planira dodati i vizualne mogućnosti iz DeepMindovog projekta Astra, što znači da će Gemini Live morati neprimjetno raditi u pozadini bez ometanja korisnikovog standardnog korištenja telefona.
Google također ažurira trenutni model Gemini 2.0 s nekoliko manjih i većih AI modela za različite primjene. U blog objavi prošle srijede, tvrtka je predstavila eksperimentalnu verziju Gemini 2.0 Pro, koji se predstavlja kao najmoćniji korisnički model do sada. Gemini 2.0 Pro primarno je namijenjen programerima i dostupan je pretplatnicima usluge Gemini Advanced.
Pitanje ostaje koliko je novi model zapravo napredan. Google tvrdi da nadmašuje Gemini 2.0 Flash u većini testova, osim u jednom – sposobnosti pružanja “činjenično točnih odgovora na temelju dokumenata i različitih korisničkih zahtjeva”. Također je predstavljen model Gemini 2.0 Flash-Lite, koji ima iste zahtjeve za napajanje, ali daje točnije odgovore od prethodne verzije Gemini 1.5 Flash. Ove nadogradnje dolaze ubrzo nakon što je OpenAI predstavio svoj o3 reasoning model, uključujući i njegovu manju verziju o3-mini.
Samsungov Galaxy S25 donio je mogućnost korištenja Gemini AI-a u različitim aplikacijama. Dugi pritisak na tipku za uključivanje omogućuje izvođenje radnji poput pretvaranja tekstualne poruke u kalendarski događaj bez korištenja ruku. Međutim, testovi su pokazali da su AI značajke još uvijek prilično osnovne i nisu u stanju obavljati složenije zadatke, zbog čega korisnici često moraju provjeravati i ispravljati rezultate.
Google planira svoje najbolje mobilne AI značajke predstaviti kasnije ove godine, uoči Google I/O 2025 i očekivanog lansiranja Pixel 10 uređaja. U usporedbi sa Samsungovim rješenjima, Google nastoji impresionirati korisnike svojim AI mogućnostima. Ostaje za vidjeti hoće li sva ova ulaganja i hype opravdati očekivanja.