Het nieuwe Gemini-model van Google Deepmind ziet er ongelooflijk uit, maar het zou het hoogtepunt van de AI-hype kunnen betekenen

“Het model is van nature capabeler”, zegt Sundar Pichai, CEO van Google en moederbedrijf Alphabet, tegen MIT Technology Review. “Het is een platform. AI is een diepgaande platformverandering, groter dan het web of mobiel. En dus is het een grote stap voor ons.”

Het is een grote stap voor Google, maar niet noodzakelijkerwijs een grote sprong voor het vakgebied als geheel. Google DeepMind beweert dat Gemini beter presteert dan GPT-4 in 30 van de 32 standaard prestatiemetingen. En toch zijn de grenzen daartussen dun. Wat Google DeepMind heeft gedaan, is de beste huidige AI-mogelijkheden combineren in één krachtig pakket. Afgaande op de demo’s doet het een heleboel dingen heel goed, maar een paar dingen hebben we nog niet eerder gezien. Ondanks alle geruchten over het volgende grote ding, zou Gemini een teken kunnen zijn dat we de piek van de AI-hype hebben bereikt. Tenminste voor nu.

Chirag Shah, een professor aan de Universiteit van Washington die gespecialiseerd is in online zoeken, vergeleek de lancering met de onthulling door Apple van elk jaar een nieuwe iPhone. “Misschien zijn we nu gewoon naar een andere drempel geklommen, waar het niet zoveel indruk op ons maakt, omdat we zojuist zoveel hebben gezien”, zegt hij.

Net als GPT-4 is Gemini multimodaal, wat betekent dat het is getraind om meerdere soorten invoer te verwerken: tekst, afbeeldingen en audio. Hij kan deze verschillende formaten combineren om vragen over allerlei onderwerpen te beantwoorden, van huiswerk tot wiskunde op de universiteit en economie.

In een persdemo gisteren liet Google zien dat Gemini een screenshot kan maken van een bestaande grafiek, honderden pagina’s aan onderzoek kan analyseren met nieuwe gegevens en de grafiek vervolgens kan bijwerken met die nieuwe informatie. In een ander voorbeeld krijgen Geminis afbeeldingen te zien van een omelet die in een pan wordt gekookt en wordt gevraagd (met spraak in plaats van met tekst) of de omelet al gaar is. “Het is nog niet klaar omdat de eieren nog vloeibaar zijn”, antwoordt hij.

De meeste mensen zullen echter moeten wachten op de volledige ervaring. De vandaag gelanceerde versie is de backend van Bard, de op tekst gebaseerde zoekchatbot van Google, die volgens het bedrijf meer geavanceerde mogelijkheden voor gevolgtrekking, planning en begrip zal bieden. De volledige release van Gemini zal in de komende maanden plaatsvinden. De nieuwe Bard met Gemini zal in eerste instantie in het Engels verkrijgbaar zijn in meer dan 170 landen, exclusief de EU en het VK. Dit zou het bedrijf in staat moeten stellen om samen te werken met lokale toezichthouders, aldus Sissie Hsiao, Google’s vice-president die verantwoordelijk is voor Bard.

Gemini is ook verkrijgbaar in drie maten: Ultra, Pro en Nano. Ultra is de volledige versie; Pro en Nano zijn aangepast aan toepassingen die met beperktere computerbronnen werken. Nano is ontworpen om te werken op apparaten zoals de nieuwe Pixel-telefoons van Google. Ontwikkelaars en bedrijven hebben vanaf 13 december toegang tot Gemini Pro. Gemini Ultra, het krachtigste model, zal “begin volgend jaar” beschikbaar zijn na “uitgebreide vertrouwens- en veiligheidscontroles”, vertelden leidinggevenden van Google aan verslaggevers tijdens een persconferentie.

“Ik beschouw het als het tijdperk van het Gemini-model”, vertelde Pichai ons. “Dit is hoe Google DeepMind AI zal bouwen en bevorderen. Het zal dus altijd de grens vormen van waar we vooruitgang boeken op het gebied van kunstmatige intelligentie.”