Google predstavio svoj odgovor na ChatGPT. Impresivan je

Piše: Nenad Jarić Dauenhauer

19:23, 11. svibnja 2023.

Google predstavio svoj odgovor na ChatGPT. Impresivan je — Foto: EPA, Profimedia

Tekst se nastavlja ispod oglasa

IZVRŠNI direktor Googlea Sundar Pichai predstavio je jučer brojne nove značajke koje je njegova kompanija razvila odgovarajući na izazove koje je pred nju postavio brzi prodor ChatGPT-ja, ali i brojnih drugih sustava umjetne inteligencije.

Na Google I/O Developers Conference u Mountain Viewu, u Kaliforniji, Pichai je u dvosatnom nastupu, koji je pomalo nalikovao na glazbeni koncert, među ostalim, predstavio nove Googleove planove za razvoj umjetne inteligencije, najnoviji telefon iz Googleove Pixel serije Pixel 7A, prijeklopni telefon Pixel Fold, Tablet i Bard AI.

Poruke optimizma

"Dok stojimo na vrhu nove ere, novih proboja u AI-u, mi smišljamo načine na koje možemo pomoći. Imat ćemo priliku poboljšati živote milijardi ljudi.Dat ćemo priliku biznisima da napreduju i razvijaju se. Pomoći ćemo društvima da odgovore na najteža pitanja s kojima se moramo suočiti. No mi to ne uzimamo zdravo za gotovo. Stoga, iako su naše ambicije velike, naš pristup će uvijek biti odgovoran jer je naš cilj da AI bude svima od pomoći", ističe se u uvodniku konferencije uz prikladne vizualne ilustracije, među kojima su i utjecaji klimatskih promjena na koraljne grebene.

PaLM 2, konkurencija GPT-ju

Posebnu pozornost na konferenciji privuklo je predstavljanje najnovijeg velikog jezičnog modela PaLM 2, unaprijeđenog alata kojim se koristi Googleov chat Bard, konkurent OpenAI-evom ChatGPT-ju. On će pokretati više od 25 Googleovih proizvoda i značajki.

Usto je najavljen i Gemini, koji bi trebao biti sljedeći korak u razvoju sustava PaLM 2.

Guglanje u dvije varijante

Prema najavi, Googleova tražilica do sada je bila jedan proizvod, no guglanje će od sada biti podijeljeno u dva odvojena doživljaja rada s umjetnom inteligencijom.

Prvi je klasična Googleova tražilica. Počevši od ovog mjeseca, ljudi u SAD-u moći će pretraživati internet putem Google Labsa, tvrtkinog inkubatora ideja. Ova tražilica će zahvaljujući AI-u moći sažimati odgovore umjesto korisnika, bez potrebe za klikanjem na linkove ili za povlačenjem informacija s Wikipedije.

Naglasak na sigurnosti i točnosti

No, Google u svom vodećem proizvodu ipak izbjegava sažimanje nekih informacija poput udarnih vijesti, a svaku činjenicu koju će predstavljati njegova će umjetna inteligencija dvaput provjeravati prije nego što je predstavi u web-pregledniku Chrome na računalu ili u Googleovoj mobilnoj aplikaciji.

Tu je naglasak predstavnika kompanije još jednom bio da im je vrlo važna sigurnost – točnost odgovora te izbjegavanje grešaka i "haluciniranja" sustava, a time i širenja dezinformacija.

Tekst se nastavlja ispod oglasa

"Modeli PaLM 2 jači su u logici i rasuđivanju", rekao je Pichai ističući da su dobili široku obuku o znanstvenim i matematičkim temama te da su sposobni razumjeti više od 100 jezika.

Poznato je da je ChatGPT relativno lako navesti da pogriješi u rješavanju jednostavnih matematičkih i logičkih zadataka ili da počne halucinirati izbacujući besmislene informacije. Prema Pichaiu, PaLM 2 ne bi trebao biti tako nepouzdan.

PaLM 2 će biti dostupan u nizu raznih veličina, nazvanih Gecko, Otter, Bison i Unicorn. Gecko je toliko lagan da će moći raditi na mobilnim uređajima čak i kada su izvan mreže.

Podešen za različita znanja

Google je predstavio PaLM 2 kao cijelu obitelj modela koji su fino podešeni za različita znanja specifična za različite domene.

Primjerice, SEC-PaLM verzija fino je podešena za slučajeve upotrebe u kojima je važna sigurnost, što znači da će se AI moći koristiti za bolje otkrivanje malicioznih softvera te kao pomoć sigurnosnim stručnjacima u razumijevanju i rješavanju prijetnji.

Korisniji za programere

PaLM 2 je, među ostalim, temelj Codeyja, Googleovog specijaliziranog modela za kodiranje i otklanjanje pogrešaka, koji je u srijedu također lansiran kao dio usluge dovršavanja i generiranja koda.

Pichai je naglasio da bi PaLM 2 mogao biti od velike pomoći programerima diljem svijeta, čak i onima koji surađuju s kolegama koji govore različite jezike. Primjerice, programer u SAD-u, koji zajedno s kolegom u Japanu radi na otklanjanju pogrešaka u kodu, moći će zatražiti od PaLM-a 2 da popravi grešku te da kodu doda komentare na japanskom.

Model je treniran na 20 programskih jezika, uključujući najpopularnije kao što su JavaScript i Python, ali i Prolog, Verilog i Fortran.

Medicinski suradnik

Med-PaLM 2 fino je podešen za medicinsko znanje.

Tekst se nastavlja ispod oglasa

On, među ostalim, može sintetizirati informacije iz medicinskih snimaka, što bi radiolozima moglo pomoći u tumačenju i priopćavanju rezultata. Postoje planovi da se njegove mogućnosti za tumačenje informacija iz medicinskih slika, kao što su rendgenske i mamografi, dalje poboljšavaju.

Prema Pichaiju, Med-PaLM 2 je u usporedbi s osnovnim modelom uspio smanjiti pogreške u zaključivanju za čak devet puta, čime se približio učinku kliničkih stručnjaka. Time je Med-PaLM 2 postao prvi jezični model koji na pitanja u stilu ispita za medicinsko licenciranje odgovara na visokoj stručnoj razini, a s vremenom bi trebao postati koristan suradnik medicinskim djelatnicima.

Pichai je istaknuo da su to samo neki primjeri kako se model može koristiti u specijaliziranim domenama te da s nestrpljenjem očekuje njegovu širu primjenu.

Gemini, budući konkurent GPT-ja

Pichai je također službeno otkrio postojanje Geminija, velikog modela strojnog učenja o kojemu se spekuliralo u ožujku.

Model, koji je još uvijek u razvoju, ima za cilj konkurirati OpenAI-evom GPT-ju, koji pokreće ChatGPT. Gemini bi trebao biti poboljšanje Googleovog modela strojnog učenja PaLM 2, koji pokreće Bard, rivala ChatGPT-ju, ali i druge AI-e za razgovor u Googleovim proizvodima.

Gemini bi mogao postati jedan od najvećih i računalno najintenzivnijih modela AI-a ikada stvorenih.

Pichai je na konferenciji rekao da će on imati veće mogućnosti "pamćenja i planiranja" od PaLM-a 2, iako nije iznio detalje niti je najavio datum njegova puštanja u rad.

Gemini je dizajniran da bude multimodalan i visoko učinkovit, a Pichai je istaknuo da Google već sada svjedoči impresivnim multimodalnim mogućnostima koje nisu viđene u prethodnim modelima.

Nakon finog podešavanja i temeljitog sigurnosnog testiranja, Gemini će biti dostupan u različitim veličinama i mogućnostima, slično kao PaLM 2.

Tekst se nastavlja ispod oglasa

Označavanje umjetnih kreacija

Pichai je, među ostalim, najavio alate za prepoznavanje umjetno generiranih sadržaja. Tu je predstavio dva ključna pristupa - vodene žigove i metapodatke. Vodeni žigovi bi ugrađivali informacije izravno u sadržaj na takav način da se one zadržavaju čak i ako se u sadržaju izvrše neke izmjene.

Izvršni direktor istaknuo je da se Google od samog početka usredotočio na integraciju vodenih žigova i drugih tehnika označavanja umjetno stvorenih sadržaja.

"Ako pogledamo sintetičku sliku, impresivno je koliko izgleda stvarno", rekao je Pichai pa dodao: "Možete zamisliti koliko će ovo biti važno u budućnosti."

Metapodaci će kreatorima sadržaja omogućiti da izvornim datotekama dodaju dodatni kontekst i tako pruže više informacija o generiranim slikama. Pichai je ustvrdio da će sve slike generirane umjetnom inteligencijom nositi takve metapodatke.

Googleove karte

Google je na konferenciji najavio još cijeli niz novina koje će biti uvedene u postojeće i nove proizvode.

Tako će, primjerice, Google karte u odabranim gradovima imati novu značajku "Immersive View for Routes" (dubinski uvid u rute). Ona će na jednom mjestu donositi sve informacije koje bi korisniku mogle trebati na putovanju, uključujući pojedinosti sa simulacijama prometa, biciklističkim stazama, složenim raskrižjima, parkinzima itd.

Magic Editor

Ljudi uvijek žele nešto mijenjati na fotografijama koje su upravo snimili. Googleova značajka Magic Editor ima umjetnu inteligenciju koja će se moći koristiti za složenija uređivanja u određenim dijelovima fotografija, primjerice, u prvom planu ili u pozadini, a koja će moći popuniti praznine u fotografiji ili čak promijeniti položaj subjekta za bolje kadriranje.

Magic Compose

Google je predstavio i novu značajku pod nazivom Magic Compose, koja se služi porukama i razgovorima za ponovno pisanje tekstova u različitim stilovima. Na primjer, Magic Compose mogao bi učiniti da neka poruka zvuči pozitivnije ili profesionalnije ili da zvuči kao da ju je napisao netko drugi, neki poznati književnik.

Bard će moći generirati slike

Google je najavio da će ukloniti svoju listu čekanja za Bard i učiniti ga dostupnim na engleskom u više od 180 zemalja i teritorija. Usto će pokrenuti podršku za japanski i korejski, a u bliskoj budućnosti za 40-ak jezika.

Tekst se nastavlja ispod oglasa

Novitet je i Bardova sposobnost da u svojim odgovorima prikazuje slike.

Osim toga, Google se povezao s Adobeom za neke mogućnosti generiranja umjetnosti tako da će njegovi korisnici pomoću Fireflya moći generirati slike i zatim ih modificirati koristeći Express.

Korisnici će također moći birati između predložaka, fontova i tzv. stock slika.

Googleov radni prostor postaje pametniji

Googleov Workspace paket također dobiva AI unapređenje koje će ga učiniti pametnijim. Među ostalim on će moći automatski generirati tablice u Tablicama i stvarati slike u Slidesu i Meetu. Nove značajke za Slides i Meet uključuju mogućnost upisivanja vrste vizualizacije koja se traži, a koju će AI stvoriti. Konkretno, za Google Meet to znači stvaranje prilagođenih pozadina.

Kreiranje glazbe

Google je predstavio i novi glazbeni AI alat MusicLM, koji pretvara tekst u glazbu. Primjerice, ako ste domaćin večere, moći ćete jednostavno upisati "nostalgičan jazz za večeru" i alat će stvoriti nekoliko verzija skladbe s odgovarajućim raspoloženjem.

Univerzalni prevoditelj

Google je, među ostalim, objavio da testira moćnu novu uslugu prevođenja koja videozapise prevodi na novi jezik, a istovremeno sinkronizira usne govornika s riječima stranog jezika.

Ova eksperimentalna usluga uzima ulazni video, primjerice, neko predavanje s online tečaja izvorno snimljenog na engleskom jeziku, transkribira govor, prevodi ga, regenerira govor na tom jeziku, usklađujući stil i ton, a zatim uređuje video kako bi govornikove usne više odgovarale novom zvuku.

***

Novu knjigu Indexovog znanstvenog novinara Nenada Jarića Dauenhauera, koja tematizira najkontroverznije i najzanimljivije teme u znanosti poput klimatskih promjena, pseudoznanosti, pandemije, GMO-a i nuklearki, možete nabaviti ovdje.

Znate li nešto više o temi ili želite prijaviti grešku u tekstu? Kliknite ovdje.