Google claimt dat nieuwe AI Gemini beter presteert dan GPT-4 en menselijke experts

Google heeft een nieuw AI-model vrijgegeven dat volgens het bedrijf beter presteert dan zijn voorgangers. Gemini zou zowel GPT-4, het AI-model waar ChatGPT Plus op draait, als menselijke experts overtreffen in een reeks intelligentietests.

Google-CEO Sundar Pichai onthulde Gemini afgelopen mei tijdens een conferentie. Het model was toen nog volop in ontwikkeling. Nu is het geavanceerde model openbaar gemaakt.

Google heeft een versie van Gemini geïntegreerd in Bard, de online chatbot van het bedrijf. Sinds vorige week is deze upgrade beschikbaar voor onder meer het Amerikaanse publiek. In Europa is het systeem nog niet uitgerold.

Iedereen kan overweg met een 'derde duim'

Iedereen kan wennen aan een extra robotduim, van kinderen tot senioren. Dat stelden Britse onderzoekers vast bij een wetenschapsfestival.

Drie versies

Google heeft drie versies van Gemini gemaakt, voor verschillende toepassingen. De drie versies – Nano, Pro en Ultra – hebben verschillende groottes en dus ook verschillende mogelijkheden.

Dergelijke AI-modellen leren gaandeweg steeds beter hun werk te doen door te oefenen met heel veel trainingsgegevens. De AI-modellen gebruiken daarbij een bepaald aantal parameters. Dat zijn de variabelen die ze tijdens hun trainingsproces aanpassen om steeds beter voorspellingen te doen. Google heeft niet onthuld hoe groot Pro en Ultra zijn. Het is dus onbekend hoe groot hun database met trainingsgegevens is, en met hoeveel parameters ze werken.

Van de kleinste versie, Nano, weten we meer. Nano is ontworpen om op smartphones te werken. Het systeem bestaat eigenlijk uit twee modellen: één voor langzamere telefoons, met 1,8 miljard parameters, en één voor krachtigere apparaten, met 3,25 miljard parameters.

Het is lastig om de mogelijkheden van AI-modellen met elkaar te vergelijken, maar naar schatting werkt GPT-4 met 1,7 biljoen parameters en Meta’s LLAMA-2 met 70 miljard.

Getoetst

De middenklasse-versie van Gemini, Pro, verslaat enkele andere populaire AI-modellen, zoals OpenAI’s GPT-3.5, waar de gratis versie van ChatGPT op draait. De nog krachtigere Ultra overtreft alle bestaande AI-modellen, zegt Google.

De AI is onderworpen aan de ‘Massive Multitask Language Understanding’-test, of MMLU. Dat is een standaardtest in het vakgebied. Bij deze test moet een AI-model een breed scala aan taken verrichten. Zo wordt het getoetst op zijn ‘wereldkennis’ door te kijken of het feiten over geschiedenis en aardrijkskunde kan oplepelen, of het wiskundige sommen kan oplossen en meer. Ook onderwerpen zoals logisch redeneren en morele problemen in alledaagse scenario’s komen aan bod. Gemini scoorde 90 procent op de test.

Menselijke experts halen naar verwachting een score van 89,8 procent. Het is de eerste keer dat een AI ook mensen verslaat in de MMLU-test.

Gemini sleepte dus ook de beste score van alle bekende AI-modellen binnen. In deze test scoorde GPT-4 87 procent, LLAMA-2 68 procent en Anthropic’s Claude 2 78,5 procent. Gemini versloeg zijn concurrenten ook in acht andere veelgebruikte benchmarktests.

Gemini zou ook beter zijn in het maken van nieuwe software dan eerdere modellen. Vorig jaar bracht DeepMind een AI-programmeur uit, AlphaCode genaamd, die volgens het bedrijf 50 procent van de menselijke programmeurs versloeg. Een bijgewerkte versie van AlphaCode die met Gemini werkt, zou volgens het bedrijf 85 procent van de menselijke softwareschrijvers verslaan.

Chatbot Bard

Het Pro-model van Gemini zal worden geïntegreerd in Bard, de online chatbot van Google. Het bedrijf zegt dat het begin volgend jaar een andere versie van Bard zal lanceren, Bard Advanced. Deze zal het nog grotere Gemini Ultra-model bevatten.

De nieuwe versie van Bard is vanaf vorige week beschikbaar in het Engels in meer dan 170 landen, maar nog niet in het Verenigd Koninkrijk en Europa. Googles vicevoorzitter Sissie Hsiao zegt dat dat komt door de Europese regelgeving. ‘We hebben te maken met het lokale beleid en werken met regelgevende instanties om ervoor te zorgen dat we ons aan de lokale wetten houden’, zegt zij. De nieuwe versie van Bard is ook nog niet beschikbaar in andere talen dan Engels.

Tekst, geluid en beeld

Eli Collins, vicevoorzitter van Google’s AI DeepMind, zegt dat Gemini het grootste en beste model van het bedrijf is, en daarnaast ook het breedst inzetbare. Het kan gebruikt worden voor een breed scala aan taken. Zo zijn veel huidige AI-modellen gericht op tekst, maar is Gemini getraind op tekst, afbeeldingen en geluid. Je kunt hem dan ook aansturen door input te geven in al deze formaten, en hij kan ook in deze vormen zijn output leveren.

Voor het gebruik in Bard kunnen mensen vooralsnog alleen tekstaanwijzingen gebruiken. Google belooft dat de audio- en beeldopties ‘in de komende maanden’ mogelijk zullen worden. Google stelde tijdens de conferentie geen versies van Gemini beschikbaar om te testen, maar liet wel demonstraties zien van hoe het AI-model huiswerkproblemen oploste en met live video-invoer werkte.

Collins zegt dat Gemini nog steeds getest wordt om precies te bepalen hoe goed het model werkt in de verschillende media, talen en toepassingen. ‘We zijn nog steeds bezig om alle nieuwe mogelijkheden van Ultra te begrijpen’, zegt hij.

Google claimt dat nieuwe AI Gemini beter presteert dan GPT-4 en menselijke experts

Iedereen kan overweg met een 'derde duim'

Drie versies

Getoetst

Chatbot Bard

Tekst, geluid en beeld

Delen:

Over de auteur

Reacties
Reacties tonen

Plaats een reactie Reactie annuleren

Subtotaal	€ 0,00
Totaal	€ 0,00

Google claimt dat nieuwe AI Gemini beter presteert dan GPT-4 en menselijke experts

Iedereen kan overweg met een 'derde duim'

Drie versies

Getoetst

Chatbot Bard

Tekst, geluid en beeld

Delen:

Over de auteur

Reacties Reacties tonen

Plaats een reactie Reactie annuleren

Gerelateerde artikelen

Oogbolreflecties onthullen 3D-model van waar iemand naar kijkt

AI helpt wielrenners berekenen hoeveel ze moeten eten

Google en Baidu lanceren alternatieven voor AI-chatbot ChatGPT

Reacties
Reacties tonen