Ako ste sumnjali da će sadržaj koji javno objavite na mreži biti proslijeđen modelima umjetne inteligencije, pogledajte Googleova ažurirana pravila o privatnosti. U dokumentu se sada izričito navodi da tvrtka zadržava pravo prikupljanja i analize gotovo svega što ljudi dijele na webu za obuku svojih AI sustava, a korištenjem njihovih proizvoda, svi korisnici pristaju na ta pravila.
Googleovo ažuriranje tijekom vikenda uvelo je novi tekst u njegova pravila o privatnosti. Prethodno je navedeno da će se podaci ljudi koristiti za treniranje “jezičnih” modela, spominjući samo Google Translate. Ažurirana verzija mijenja ovo u “AI modeli”, posebno spominjući Bard i Cloud AI uz Translate.
Jedno od mnogih spornih pitanja s generativnim AI sustavima kao što su ChatGPT i Bard je način na koji oni uzimaju i koriste podatke. To bi trebala biti javno dostupna informacija, ali to ne sprječava priču o plagijatima i brigu o privatnosti, a da ne spominjemo mogućnost da AI pogrešno protumači ono što je rečeno ili ponudi stare, zastarjele odgovore. Čak je i Google upozorio zaposlenike da budu oprezni kada koriste chatbotove poput vlastitog Barda jer mogu dati neželjene prijedloge koda.
Također se postavlja pitanje je li ova vrsta scapinga podataka uopće legalna. Kreator ChatGPT-a OpenAI suočava se s tužbama zbog optužbi da je nezakonito prikupljao osobne podatke od korisnika interneta i koristio ih za stvaranje svojih proizvoda.
OpenAI se također bavi tužbom zbog kršenja autorskih prava i privatnosti u vezi s tvrdnjama da je koristio knjige zaštićene autorskim pravima bez dopuštenja za obuku svojih AI sustava. Tvrtka je navodno nezakonito kopirala tekst iz tih naslova tako što nije dobila privolu od nositelja autorskih prava i nije im dala zasluge ili naknadu.
Čini se da je scraping podataka posebno mučna tema za Elona Muska. Twitter je tijekom vikenda privremeno ograničio broj tweetova koje računi mogu pročitati po danu kako bi se navodno pozabavili “ekstremnim razinama” krađe podataka i “manipulacije sustavom” na platformi – iako se ne slažu svi da je to bio razlog za ograničenje.
Reddit se također suočio s nizom problema otkako je isključio besplatan pristup svojim API-jima kako bi zaustavio prikupljanje podataka. Taj je potez rezultirao zatamnjenjem više od 8000 subreddita u znak prosvjeda, a neki su prešli na NSFW .