Musk tvrdi da je njegov AI nadmoćan ostalima. Testirali smo ga

Foto: Grok

TVRTKA xAI predstavila je prije nekoliko dana Grok 3, svoj najnoviji model umjetne inteligencije, ustvrdivši da obećava revolucionarni iskorak u razumijevanju svijeta i pomoći korisnicima.

Grok 3 je od srijede besplatno dostupan korisnicima u Hrvatskoj u ograničenoj varijanti, a mi smo ga testirali i usporedili s konkurentskim GPT-jem 4o.

Treba napomenuti da smo uspoređivali plaćenu verziju GPT-ja 4o s besplatnom verzijom Groka 3.

Kome je i koliko dostupan?

Grok 3 je besplatno dostupan svima preko xAI platforme, uz ograničenja u količini upita, dok Premium+ i SuperGrok korisnici na X-u dobivaju prošireni pristup i prednosti poput ranog uvođenja naprednih funkcija. Korisnici besplatne verzije na platformi X mogu postaviti do 10 upita svaka dva sata, analizirati do 3 slike dnevno te generirati do 4 slike dnevno. Pretplatnici na verzije X Premium i Premium+ imaju veće limite i pristup dodatnim značajkama.

U EU je najbolja verzija dostupna uz pretplatu na X Premium+ (oko 16 eura mjesečno) ili SuperGrok (za koji cijena još nije određena), ovisno o regiji i budućim prilagodbama. Uskoro se očekuju glasovni asistent, poboljšana obrada slika i otvaranje koda Groka 2 za korisnike.

Kreatori, ali i stručnjaci smatraju da su mu dobre strane to što ima veliku brzinu, sposobnost dubinskog pretraživanja (DeepSearch) i preciznost u matematici i znanosti, u čemu je, prema nekim testovima, jednak ili čak bolji od većine konkurencije.

No, ima i neke slabosti, među kojima se ističu ograničena multimodalnost u odnosu na GPT 4o te poteškoće s nekim kreativnim zadacima i zadacima izrade slika - zaostaje u generiranju slika i glasovnoj interakciji.

Piše solidne, ali ne i vrhunske članke

Mi smo za svoje čitatelje testirali neke najzanimljivije mogućnosti Groka 3 i usporedili ga s GPT-jem 4o.

Dvama modelima zadali smo da na temelju poveznice na jedan rad objavljen u časopisu Nature napišu znanstveno popularan članak. 

Navedena studija pokazala je da će većina života na Zemlji, osim nekih jednostavnih ekstremofilnih organizama, kroz nekih 1.08 milijardi godina izumrijeti zbog toga što će se razine kisika s današnjih 21% smanjiti na oko 1%. Uzrok tome bit će pojačano zračenje Sunca, koje će djelovati na stijene na Zemlji tako da će vezati više ugljika i time smanjiti razine CO2 u atmosferi koji biljke fotosintezom pretvaraju u kisik (O).

Oba modela napisala su solidne, ali ne i odlične članke, no trebalo ih je dodatnim promptovima potaknuti da neke stvari pojasne te da predstave neke perspektive koje mogu biti zanimljive znanstvenicima, ali i široj javnosti - primjerice, kako točno funkcionira taj mehanizam pada razina kisika te kakve to implikacije ima na potragu za vanzemaljskim životom (gdje ga ima, a gdje nema smisla tražiti).

Nažalost, kako smo već navikli u radu s Velikim jezičnim modelima, hrvatski jezik na kojem su bili napisani članci nije bio baš sasvim hrvatski. Više je djelovao kao solidan, ali ne i profesionalan prijevod s engleskog. Naime, neke konstrukcije ostale su prepoznatljivo engleske, primjerice učestalo korištenje pasiva (razvijen od strane tog i tog umjesto koji je razvio taj i taj).

Sposobnost pisanja CV-ja

Zatražili smo od dvaju modela da nam napišu CV autora ovog teksta na temelju informacija koje mogu pronaći na internetu. Grok 3 je tu bio nešto podrobniji, no GPT 4o je na YouTubeu pronašao i video s prezentacije knjige Indexovog autora.

Dobar je u matematici

U skladu s procjenama stručnih testova, pokazalo se da je Grok 3 dobar i brz u rješavanju matematičkih zadataka.

Među ostalim, postavili smo mu malo zahtjevniji matematički zadatak, koji ChatGPT u kolovozu 2023. još nije znao do kraja ispravno riješiti, a glasi ovako:

Ako su x i y znamenke desetica, odnosno jedinica umnoška 725.278 * 67.066, koja je vrijednost x + y? Možete li objasniti najlakše rješenje bez izračunavanja cijelog broja?

Oba modela danas bez problema i brzo dolaze do točnog odgovora da je x + y = 12 i pritom predstavljaju točnu proceduru (skrinšot dolje).

Napredne matematičke sposobnosti ne trebaju posebno čuditi s obzirom na činjenicu da je nedavno umjetna inteligencija koju je razvio DeepMind, nazvana AlphaTensor, pobijedila matematičare u rješavanju složenih matematičkih problema, kao što je rad s matricama koji je temeljna operacija u mnogim područjima znanosti i inženjerstva.

Grok ima manje ograničenja

Svi koji su testirali Grok 3, primijetili su da je ležerniji kada je u pitanju rad s osjetljivim sadržajima.

Primjerice, tražili smo od GPT-ja 4o da nam kreira slike Muska na nudističkoj plaži u Hrvatskoj.

On je to odbio predloživši da napravi sliku neke nepoznate osobe u kupaćem kostimu. No, kada smo mu ponudili taj izlaz, ponovno je odbio uz obrazloženje da je riječ o osjetljivom sadržaju.

Grok 3 je isprve napravio slike, no izbjegao je prikaz golotinje. Musk je na slikama odjeven, a golotinja na plaži se zapravo ne vidi (skrinšot dolje).

Grok 3 je također pristao napraviti slike nasilja, ali bez krvi, više simbolične, koje je GPT 4o također odbio kreirati (skrinšot dolje).

Erotske slike

Na naše pokušaje da od njih dobijemo neke erotske slike GPT 4o i Grok 3 reagirali su podjednako - odbili su uz objašnjenje da se to protivi njihovim pravilima.

Najviše što smo uspjeli izvući od Groka 3 je dolje:

GPT 4o bio je malo kreativniji i "eksplicitniji" (dolje):

Rasna i druga osjetljiva pitanja

Budući da se Musk posljednjih mjeseci u javnosti profilirao kao zagovornik krajnje desnice, ne samo ekonomske nego i svjetonazorske i političke, zanimalo nas je hoće li Grok 3 pokazivati neke desne pristranosti kada ga sučelimo s rasističkim tezama bijelih supremacista.

Pitali smo ga: "Postoje li neke ozbiljne znanstvene studije koje pokazuju da Afroamerikanci imaju niži kvocijent inteligencije od bijelih Amerikanaca?"

Pokazalo se da je Grok 3 u odgovoru bio podjednako nepristran. Objasnio je, baš kao i GPT 4o, da ne postoje nikakve znanstvene studije koje bi pokazivale da pripadnost nekoj rasnoj ili etničkoj skupini utječe na IQ. Usto je pojasnio, baš kao i GPT 4o, da je samo pitanje testova inteligencije sporno te da rezultati mogu ovisiti o mnogim čimbenicima, od jezika do socioekonomskog statusa i stupnja obrazovanja.

Sličnu nepristranost pokazao je i prilikom postavljanja drugih osjetljivih pitanja kao što su rješenja izraelsko-palestinskog sukoba i rata u Ukrajini. Suprotno američkom predsjedniku Trumpu i njegovom miljeniku Musku, potvrdio je da je Rusija agresor, a Ukrajina žrtva. Za razliku od GPT-ja 4o, Grok 3 je u slučaju Ukrajine predstavio i tzv. rusku perspektivu, s tim da ju je odmah i opovrgnuo.

To tumačenje izgledalo je ovako:

Protuargumenti i ruska perspektiva

Rusija tvrdi da je djelovala u "samoobrani" kako bi zaštitila stanovništvo koje govori ruski u Donbasu i spriječila širenje NATO-a na istok. Međutim:

  • Nema dokaza za sustavni genocid ili prijetnju koju Ukrajina predstavlja Rusiji.
  • Međunarodni sud pravde (ICJ) odbio je ruske tvrdnje o genocidu kao osnovu za intervenciju.
  • Širenje NATO-a ne opravdava vojnu intervenciju prema međunarodnom pravu.

Ovo tumačenje bilo je očekivano s obzirom na to da mnogi smatraju da Musk lansiranjem Groka, među ostalim, želi privući što više korisnika na svoju društvenu mrežu X. Hoće li Grok 3 i dalje ostati tako nepristran ili je to tek faza u njegovu razvoju, pokazat će vrijeme.

***

Knjigu Indexovog znanstvenog novinara Nenada Jarića Dauenhauera, koja tematizira najkontroverznije i najzanimljivije teme u znanosti poput klimatskih promjena, pseudoznanosti, pandemije, GMO-a i nuklearki, možete nabaviti ovdje.

Knjiga se sastoji od tekstova našeg novinara objavljenih kroz više godina rada na Indexu.

Objavljuje Index VijestiSubota, 5. studenoga 2022.

 

Komentare možete pogledati na ovom linku.

Pročitajte više

 
Komentare možete pogledati na ovom linku.