Deze week in AI: Microsoft plakt een AI-advertentie op toetsenborden

Het bijhouden van een snel evoluerende industrie als AI is een hele opgave. Dus hoewel AI het niet voor je kan doen, is hier een handig overzicht van recente verhalen in de wereld van machinaal leren, samen met opmerkelijk onderzoek en experimenten die we zelf niet hebben behandeld.

Deze week introduceerde Microsoft op het gebied van kunstmatige intelligentie een nieuwe standaard pc-toetsenbordindeling met een “Copilot” -toets. Je hebt het goed gehoord: in de toekomst zullen Windows-machines een speciale sleutel hebben om de AI-aangedreven assistent Copilot van Microsoft te starten, ter vervanging van de juiste Control-toets.

We stellen ons voor dat deze stap bedoeld is om de ernst aan te geven van de investeringen van Microsoft in de race om AI-dominantie bij consumenten (en bedrijven trouwens). Dit is de eerste keer in ~30 jaar dat Microsoft de Windows-toetsenbordindeling heeft gewijzigd; Laptops en toetsenborden met de Copilot-dongle worden naar verwachting eind februari verzonden.

Maar is het allemaal een grap? Doen Windows-gebruikers dat echt? wensen AI Shortcut – of Microsofts kijk op de AI-periode?

Microsoft heeft zeker een show gemaakt door bijna al zijn oude en nieuwe producten te injecteren met “Copilot” -functionaliteit. In flitsende keynotes, gelikte demo’s en nu een AI-keynote prijst het bedrijf zijn AI-technologie aan – en zet erop in om de vraag te stimuleren.

De vraag is niet zeker. Maar om eerlijk te zijn. Slechts weinig leveranciers zijn erin geslaagd virale AI-hits om te zetten in succes. Kijk naar OpenAI, maker van ChatGPT, dat tegen eind 2023 naar verluidt de jaarlijkse omzet van $1,6 miljard zal overschrijden. Generatief kunstplatform Midjourney is ook winstgevend – en heeft nog steeds geen cent aan extern kapitaal ontvangen.

Nadruk op een paar, Echter. De meeste leveranciers, gebukt onder de kosten van training en het gebruik van de modernste AI-modellen, hebben steeds grotere hoeveelheden kapitaal moeten zoeken om het hoofd boven water te houden. Anthropic zou bijvoorbeeld 750 miljoen dollar ophalen in een ronde die het op ruim 8 miljard dollar zou brengen.

Microsoft hoopt, samen met zijn chippartners AMD en Intel, dat AI-verwerking steeds meer zal verschuiven van dure datacenters naar on-premise silicium, waardoor AI in het proces wordt gecommoditiseerd – en dat zou wel eens gelijk kunnen hebben. Intel’s nieuwe lijn consumentenchips is voorzien van aangepaste kernen om AI aan te drijven. Bovendien zouden nieuwe datacenterchips zoals die van Microsoft het trainen van een model goedkoper kunnen maken dan het momenteel is.

Maar er is geen garantie. De echte test zal zijn om te zien of Windows-gebruikers en zakelijke gebruikers, gebombardeerd met wat neerkomt op Copilot-reclame, interesse tonen in de technologie – en of ze erdoor opvallen. Als ze dat niet doen, zal het misschien niet lang duren voordat Microsoft het Windows-toetsenbord opnieuw moet ontwerpen.

Hier zijn enkele andere interessante AI-verhalen van de afgelopen dagen:

Copilot komt naar mobiel: In meer Copilot-nieuws heeft Microsoft stilletjes Copilot-clients naar Android en iOS gebracht, samen met iPadOS.
GPT-winkel: OpenAI heeft plannen aangekondigd om een winkel te lanceren voor GPT, apps op maat gebaseerd op de tekstgenererende AI-modellen (bijv. GPT-4), in de daaropvolgende week. De GPT Store werd vorig jaar aangekondigd tijdens OpenAI’s eerste jaarlijkse ontwikkelaarsconferentie, DevDay, maar werd in december uitgesteld – vrijwel zeker vanwege een leiderschapswisseling die in november plaatsvond onmiddellijk na de oorspronkelijke aankondiging.
OpenAI vermindert het reg-risico: In ander OpenAI-nieuws wil de startup zijn regelgevingsrisico in de EU verminderen door een groter deel van zijn activiteiten naar het buitenland te sturen via een Ierse entiteit. Natasha schrijft dat deze stap het vermogen van sommige privacywaakhonden van het blok om eenzijdig op problemen te reageren zal verminderen.
Robots trainen: Het DeepMind Robotics-team van Google onderzoekt manieren om robots een beter begrip te geven van wat wij mensen van hen willen, schrijft Brian. Het nieuwe systeem van het team kan een vloot van samenwerkende robots beheren en taken voorstellen die met de hardware van de robot kunnen worden uitgevoerd.
Het nieuwe bedrijf van Intel: Intel draait een nieuw platformbedrijf, Articul8 AI, ondersteund door Boca Raton, de in Florida gevestigde vermogensbeheerder en investeerder DigitalBridge. Zoals een woordvoerder van Intel uitlegt, levert het platform van Articul8 “AI-mogelijkheden die klantgegevens, training en gevolgtrekkingen binnen de veiligheidsperimeter van de onderneming houden” – een aantrekkelijk vooruitzicht voor klanten in sterk gereguleerde sectoren zoals de gezondheidszorg en de financiële dienstverlening.
De donkere visserij-industrie, blootgelegd: Satellietbeelden en machinaal leren bieden een nieuw, veel gedetailleerder beeld van de maritieme industrie, met name het aantal en de activiteiten van vissers- en transportschepen op zee. Het blijkt dat ze bestaan manier meer van hen dan openbaar beschikbare gegevens suggereren – een feit onthuld door nieuw onderzoek gepubliceerd in Nature door het Global Fishing Watch-team en verschillende samenwerkende universiteiten.
Zoeken met AI: Perplexity AI, een platform dat kunstmatige intelligentie toepast op zoeken op internet, heeft in een financieringsronde $73,6 miljoen opgehaald, waardoor het bedrijf op $520 miljoen wordt gewaardeerd. In tegenstelling tot traditionele zoekmachines biedt Perplexity een chatbot-achtige interface waarmee gebruikers vragen kunnen stellen in natuurlijke taal (bijvoorbeeld “Verbranden we calorieën terwijl we slapen?”, “Wat is het minst bezochte land?”, enzovoort).
Klinische aantekeningen, automatisch geschreven: In meer financieringsnieuws: de in Parijs gevestigde startup Nabla heeft maar liefst 24 miljoen dollar opgehaald. Een bedrijf dat een samenwerking met Permanente Medical Groupeen divisie van de Amerikaanse gezondheidszorggigant Kaiser Permanente werkt aan een ‘AI-co-piloot’ voor artsen en ander klinisch personeel die automatisch medische rapporten registreert en schrijft.

Meer machinaal leren

U herinnert zich wellicht verschillende voorbeelden van interessant werk van het afgelopen jaar waarbij kleine wijzigingen in afbeeldingen werden aangebracht die ervoor zorgen dat machine learning-modellen bijvoorbeeld een afbeelding van een hond voor een afbeelding van een auto verwarren. Ze doen dit door ‘verstoringen’, kleine veranderingen in de pixels van het beeld, toe te voegen in een patroon dat alleen het model kan waarnemen. Of dat deden ze tenminste gedachte alleen het model kon het zien.

Een experiment van Google DeepMind-onderzoekers toonde aan dat wanneer een afbeelding van bloemen werd verstoord om er voor een kunstmatige intelligentie meer katachtig uit te zien, mensen eerder geneigd waren het beeld als katachtig te omschrijven, ook al leek het absoluut niet langer op een kat. Idem voor andere veelvoorkomende voorwerpen zoals vrachtwagens en stoelen.

Afbeeldingscredits: Google Deepmind

Waarom? Hoe? De onderzoekers weten het niet echt, en alle deelnemers hadden het gevoel dat ze willekeurig een keuze maakten (de impact, hoewel betrouwbaar, is nauwelijks groter dan het toeval). Het lijkt erop dat we gewoon meer opmerkzaam zijn dan we denken, maar het heeft ook implicaties voor de veiligheid en andere maatregelen, omdat het suggereert dat subliminale signalen zich inderdaad via beelden kunnen verspreiden zonder dat iemand het merkt.

Een ander interessant experiment met menselijke perceptie kwam deze week van MIT, dat machinaal leren gebruikte om een bepaald taalbegripsysteem te helpen verhelderen. Kortom, sommige eenvoudige zinnen, zoals ‘Ik liep naar het strand’, vereisten nauwelijks hersenkracht om te decoderen, terwijl complexe of verwarrende zinnen zoals ‘in wiens aristocratische systeem het een grimmige revolutie maakt’ meer en bredere activeringen produceren, zoals gemeten door fMRI.

Het team vergeleek de activeringswaarden van mensen die een verscheidenheid aan dergelijke zinnen lazen met hoe dezelfde zinnen het equivalent van corticale gebieden in een groot taalmodel activeerden. Vervolgens bouwden ze een tweede model dat leerde hoe de twee activeringspatronen met elkaar correspondeerden. Dit model kon voor nieuwe zinnen voorspellen of ze de menselijke cognitie zouden belasten of niet. Het klinkt misschien een beetje geheim, maar het is absoluut superinteressant, geloof me.

Of machinaal leren de menselijke cognitie kan nabootsen op complexere gebieden, zoals interactie met computerinterfaces, is nog steeds een open vraag. Er is echter veel onderzoek beschikbaar en het is altijd de moeite waard om ernaar te kijken. Deze week hebben we SeeAct, een systeem van onderzoekers uit de staat Ohio dat werkt door de interpretaties van de LLM van mogelijke acties nauwgezet te baseren op voorbeelden uit de echte wereld.

Afbeeldingscredits: De Ohio State Universiteit

Kortom, je kunt een systeem als GPT-4V vragen om een reservering op de site te maken, en het krijgt wat het moet doen en dat het op de knop “boeken” moet klikken, maar het weet eigenlijk niet hoe het dat moet doen . Door de manier te verbeteren waarop het raakvlakken met expliciete labels en wereldkennis waarneemt, kan het veel beter presteren, zelfs als het nog steeds maar in een fractie van de tijd lukt. Deze agentmodellen hebben nog een lange weg te gaan, maar verwachten dit jaar veel grote claims! Ik hoorde er vandaag pas een paar.

Bekijk dan eens deze interessante oplossing voor een probleem waarvan ik geen idee had dat het bestond, maar dat volkomen logisch is. Autonome schepen zijn een veelbelovend automatiseringsgebied, maar als de zee ruw is, is het moeilijk om er zeker van te zijn dat ze op koers liggen. GPS en gyroscopen volstaan niet, en het zicht kan ook slecht zijn, maar belangrijker nog: de systemen die ze bedienen zijn niet erg geavanceerd. Ze kunnen dus wild van het doel afwijken of brandstof verspillen door grote omwegen te maken als ze niet beter weten, wat een groot probleem is als je op batterijvoeding werkt. Ik heb er zelfs nooit over nagedacht!

Korea Maritime and Ocean University (nog iets waar ik vandaag over heb geleerd) stelt een krachtiger bewegwijzeringsmodel voor, gebaseerd op het simuleren van scheepsbewegingen in een computationeel vloeistofdynamicamodel. Ze suggereren dat dit betere begrip van golfslag en het effect ervan op rompen en voortstuwing de efficiëntie en veiligheid van autonoom maritiem transport ernstig zou kunnen verbeteren. Het zou zelfs zinvol kunnen zijn om het te gebruiken op bemande schepen waarvan de kapiteins niet helemaal zeker weten wat de beste aanvalshoek is voor een bepaalde bui of golfvorm!

Als je ten slotte een goede samenvatting wilt van de grote vooruitgang van vorig jaar op het gebied van de computerwetenschappen, die in 2023 veel overlapte met ML-onderzoek, bekijk dan de uitstekende recensie van Quanta.