Nova generacija

Google lansirao Gemini, svoj najnapredniji AI model: Pogledajte šta sve može

Autor: Biznis.ba 07. 12. 2023.

Gemini, novi Googleov veliki jezični model, početak je nove ere umjetne inteligencije u toj kompaniji, ako pitate njenog glavnog izvršnog direktora Sundara Pichaija. Najavljen tokom konferencije za razvojne programere I/O u junu ove godine, sad je napokon i predstavljen javnosti.

Najjasnija prednost novog velikog jezičnog modela dolazi iz njegove sposobnosti razumijevanja i interakcije s videom i zvukom. Ali, s time stižu i dosad nepoznati rizici.

Prema opisu izvršnog direktora Google DeepMinda Demisa Hassabisa, Gemini je veliki korak naprijed koji će utjecati na praktički sve Googleove proizvode.

Nije samo jedan, već tri

Osnovna verzija Gemini Nano namijenjena je uređajima s operativnim sistemom Android, na kojima će raditi i kad nisu povezani s mrežom.

Jača inačica Gemini Pro bi uskoro trebala pokretati mnoge Googleove usluge temeljene na umjetnoj inteligenciji i od danas je okosnica robota za brbljanje Bard.

Gemini Ultra je najmoćnije izdanje dosad. Čini se kako je uglavnom namijenjen podatkovnim centrima i poslovnim aplikacijama.

Ta tri modela bit će dostupna postupno na raznim razinama. Kao što je već spomenuto, Barda već sad pokreće Gemini Pro.

Korisnici pametnog telefona Pixel 8 Pro dobit će nekoliko novih značajki zahvaljujući Gemini Nano, dok bi Gemini Ultra trebao biti implementiran tokom 2024. godine.

Programeri i poslovni korisnici moći će pristupiti Geminiju Pro putem Google Generative AI Studija ili Vertex AI u Google Cloudu počevši od 13. decembra.

Od početka jedinstveni multisenzorni model

Gemini je za sada dostupan samo na engleskom, no uskoro će uskoro biti i na drugim jezicima. Bit će integriran Googleovu pretragu, njegove reklamne proizvode, web preglednik Chrome...

Ujedno će biti glavni adut u okršaju s OpenAI-jevim ChatGPT-jem, čija je premijera prije nešto više od godinu dana Google zatekla nespremnim.

Može li se Gemini nositi s njim i drugom konkurencijom?

U Googleu su uvjereni kako je njihov veliki jezični model napredniji u ogromnoj većini mjerila pomoću kojih se procjenjuje stepen razvoja umjetne inteligencije.

Najjasnija prednost dolazi iz njegove sposobnosti razumijevanja i interakcije s videom i zvukom. To je u velikoj mjeri dizajnirano.

Google nije istrenirao zasebne modele za slike i glas, kao što je OpenAI stvorio DALL-E i Whisper; od početka je izgradio jedinstveni multisenzorni model.

Trenutno osnovni modeli rade s tekstom, ali Gemini Ultra može raditi i sa slikama, video te zvukom, a trebao bi moći zahvatiti i šire od toga, kako bi uključio akciju i dodir. S vremenom bi Gemini trebao dobiti više osjetila, postati svjesniji i precizniji.

Ovi modeli i dalje 'haluciniraju', imaju predrasude i druge probleme koji muče generativnu umjetnu inteligenciju. Ali, u Googleu su uvjereni kako će postajati bolji što više znaju.

Početak velike promjene

Pravi test bit će svakodnevno korištenje za traženje ideja i informacija, pisanje računalnog koda i još puno toga. Čini se da Google vidi kodiranje posebno kao ubojit oblik primjene za Gemini.

Koristi novi sistem za generisanje koda nazvan AlphaCode 2, za koji tvrde kako radi bolje od 85 posto sudionika natjecanja u kodiranju, u odnosu na 50 posto za izvorni AlphaCode.

No, poboljšanja bi se trebala osjetiti u svemu u što će biti ugrađen.

Gemini je također, naizgled, daleko učinkovitiji model. Uvježban je na Googleovim vlastitim jedinicama za obradu tenzora, pa je brži je i jeftiniji za pokretanje od Googleovih prethodnih modela poput PaLM-a.

Google je također predstavio i novu verziju svog sistema TPU - TPU v5p - kompjuterskog sistema dizajniranog za korištenje u podatkovnim centrima za obuku i pokretanje velikih modela.