Googleov Gemini je tek početak eksplozije generativne umjetne inteligencije

Screenshot: Google

Povijest umjetne inteligencije bila je isprekidana razdobljima takozvane "zime umjetne inteligencije", kada se činilo da je tehnologija zašla u slijepu ulicu i kad je financiranje presušilo. Svako od tih razdoblja bilo je popraćeno izjavama da je učiniti strojeve istinski inteligentnim ljudima jednostavno preteško, piše Wired.

Googleovo predstavljanje Geminija, za koji se tvrdi da je nova vrsta modela umjetne inteligencije i najmoćniji do sada, sugerira da nova zima umjetne inteligencije neće doći tako skoro. Zapravo, iako je 12 mjeseci nakon pokretanja ChatGPT-ja bila velika godina za umjetnu inteligenciju, postoji dobar razlog za mišljenje da je trenutni procvat umjetne inteligencije tek na početku.

OpenAI nije imao velika očekivanja kada je u studenom 2022. lansirao "pretpregled umjerenog istraživanja" pod nazivom ChatGPT. Bio je to jednostavno test novog sučelja za njegove velike jezične modele (LLM) koji generiraju tekst.

ChatGPT je pokrenuo revoluciju

No, sposobnost chatbota da radi tako širok raspon stvari, od sintetiziranja eseja i poezije do odgovaranja na probleme kodiranja, impresionirala je i iznervirala mnoge ljude i zapalila tehnološku industriju. Kad je OpenAI dodao svoj novi GPT-4 LLM u ChatGPT, neki su stručnjaci bili toliko izbezumljeni da su preklinjali tvrtku da uspori.

Malo je dokaza da je itko poslušao taj poziv na uzbunu. Sada, kad je Google dodao gas - a možda i promijenio pravila igre najavljujući Gemini - to je postalo nezamislivo.

Google je već požurio s izravnim odgovorom na ChatGPT u obliku Barda ranije ove godine, konačno lansirajući LLM chatbot tehnologiju koju je razvio prije OpenAI-ja, ali je odlučio zadržati privatnost. Tvrdi da je s Geminijem pokrenuo novu eru, koja nadilazi LLM-ove primarno temeljene na tekstu - potencijalno postavljajući teren za novu rundu proizvoda umjetne inteligencije koji se značajno razlikuju od onih koje omogućuje ChatGPT.

Što je novo kod Geminija?

Google naziva Gemini "izvorno multimodalnim" modelom, što znači da može učiti iz podataka izvan teksta, također crpeći uvide iz zvuka, videa i slika. ChatGPT pokazuje kako modeli umjetne inteligencije mogu naučiti impresivnu količinu informacija o svijetu ako im se pruži dovoljno teksta. A neki istraživači umjetne inteligencije tvrdili su da bi jednostavno povećanje jezičnih modela povećalo njihove mogućnosti do te mjere da se mogu usporediti s ljudskim.

Ali postoji limit onoga što možete naučiti o fizičkoj stvarnosti kroz filtar teksta koji su ljudi napisali o njoj, a teško iskorjenjiva ograničenja LLM-a poput GPT-4 - kao što su halucinacije informacija, loše rezoniranje i neobični sigurnosni nedostaci - sugeriraju da primjena postojeće tehnologije ima svoja ograničenja.

Uoči predstavljanja Geminija Wired je razgovarao s Demisom Hassabisom, direktorom koji je vodio razvoj Geminija i čija prethodna postignuća uključuju vođenje tima koji je razvio nadljudski Go-playing bot AlphaGo. Bio je očekivano otvoren o Geminiju, tvrdeći da uvodi nove mogućnosti, koje će na kraju učiniti Googleove proizvode istaknutima.

OpenAI razvija tajanstveni Q*

No, Hassabis je također rekao da će LLM-ove trebati kombinirati s drugim tehnikama umjetne inteligencije kako bi se isporučili sustavi koji mogu razumjeti svijet na način na koji današnji chatbotovi ne mogu.

Hassabis je u agresivnoj konkurenciji s OpenAI-jem, no čini se da se suparnici slažu da su potrebni radikalni novi pristupi. Tajanstveni projekt koji je u tijeku u OpenAI-ju, nazvan Q*, sugerira da tvrtka također istražuje ideje koje uključuju više od pukog širenja sustava poput GPT-4.

To se poklapa s primjedbama koje je u travnju iznio generalni direktor OpenAI-ja Sam Altman, kada je jasno rekao da, unatoč uspjehu ChatGPT-ja, polje umjetne inteligencije treba veliku novu ideju kako bi ostvarilo značajan napredak.

"Mislim da smo na kraju ere u kojoj će dominirati ovi divovski modeli. Učinit ćemo ih boljim na druge načine", rekao je Altman.

Google je možda upravo pokazao pristup koji može nadmašiti ChatGPT. Ali možda je najistaknutija poruka Geminijevog predstavljanja da je Google spreman krenuti prema nečem značajnijem od današnjih chatbotova poput OpenAI-ja.