AI lost een moeilijk probleem op: computers een reukvermogen geven

Dit artikel werd oorspronkelijk gepresenteerd op Gesprek.

Meer dan honderd jaar geleden vroeg Alexander Graham Bell aan de lezers van National Geographic om iets stoutmoedigs en vernieuwends te doen: ‘een nieuwe wetenschap stichten’. Hij wees erop dat er al wetenschappen bestonden die gebaseerd waren op het meten van geluid en licht. Maar er bestond geen wetenschap van geur. Bell vroeg zijn lezers om ‘de geur te meten’.

Tegenwoordig bieden de smartphones in de broekzak van de meeste mensen indrukwekkende ingebouwde mogelijkheden, gebaseerd op de wetenschap van geluid en licht: stemassistenten, gezichtsherkenning en fotoverbetering. De geurwetenschap biedt niets vergelijkbaars. Maar die situatie is aan het veranderen nu de vooruitgang op het gebied van machinegeur, ook wel ‘gedigitaliseerde geur’ genoemd, eindelijk antwoord geeft op de oproep van Bell tot actie.

Machinaal geuronderzoek staat voor een enorme uitdaging vanwege de complexiteit van het menselijke reukvermogen. Terwijl het menselijk zicht voornamelijk afhankelijk is van receptorcellen in het netvlies – staafjes en drie soorten kegeltjes – wordt geur waargenomen via ongeveer 400 soorten receptorcellen in de neus.

Machinegeur begint met sensoren die moleculen in de lucht detecteren en identificeren. Deze sensoren dienen hetzelfde doel als de receptoren in uw neus.

Maar om nuttig te zijn voor de mens moet machinegeur nog een stap verder gaan. Het systeem moet weten hoe een bepaald molecuul of een bepaalde reeks moleculen voor een persoon ruikt. Daarvoor heeft machinale geur machine learning nodig.

Machine learning toepassen op geuren

Machine learning, en vooral een vorm van machine learning die deep learning wordt genoemd, ligt aan de basis van opmerkelijke ontwikkelingen zoals stemassistenten en gezichtsherkenningstoepassingen.

Machine learning is ook de sleutel tot de digitalisering van geuren, omdat het kan leren de moleculaire structuur van een verbinding die een geur veroorzaakt in kaart te brengen in tekstuele geurdescriptoren. Het machine learning-model leert woorden die mensen vaak gebruiken (bijvoorbeeld ‘zoet’ en ‘dessert’) om te beschrijven wat ze ervaren als ze specifieke geurveroorzakende stoffen tegenkomen, zoals vanilline.

Machine learning vereist echter grote datasets. Het internet bevat een onvoorstelbaar grote hoeveelheid audio-, beeld- en video-inhoud die kan worden gebruikt om kunstmatige intelligentiesystemen te trainen die geluiden en beelden herkennen. Maar reukmachines kampen al lang met het probleem van een gebrek aan gegevens, deels omdat de meeste mensen geuren niet zo gemakkelijk en duidelijk kunnen beschrijven als ze beelden en geluiden kunnen beschrijven. Zonder toegang tot datasets op internet zijn onderzoekers er niet in geslaagd werkelijk krachtige machine learning-modellen te trainen.

De dingen begonnen echter te veranderen in 2015 toen onderzoekers een uitdaging lanceerden om de geur van dromen te voorspellen. De wedstrijd publiceerde gegevens verzameld door Andreas Keller en Leslie Vosshall, biologen die geur bestuderen, en nodigde teams van over de hele wereld uit om hun machine learning-modellen in te dienen. De modellen moesten geurlabels zoals ‘zoet’, ‘bloemig’ of ‘fruitig’ voorspellen voor geurveroorzakende verbindingen op basis van hun moleculaire structuur.

De beste modellen werden in 2017 gepubliceerd in een artikel in het tijdschrift Science. Een klassieke machine learning-techniek genaamd Random Forest, die de resultaten van meerdere beslissingsboomdiagrammen combineert, bleek de winnaar.

Ik ben een machine learning-onderzoeker met een langdurige interesse in de toepassing van machine learning in de chemie en psychiatrie. De DREAM-uitdaging wekte mijn interesse. Ik voelde ook een persoonlijke connectie met de geur. Mijn familie vindt zijn oorsprong in het kleine stadje Kannauj in Noord-India, de parfumhoofdstad van India. Bovendien is mijn vader een scheikundige die het grootste deel van zijn carrière heeft besteed aan het analyseren van geologische monsters. Machinegeur bood dus een onweerstaanbare kans op het snijvlak van parfumerie, cultuur, chemie en machinaal leren.

De vooruitgang op het gebied van machinaal geuren begon te versnellen nadat de DREAM-uitdaging was geëindigd. Tijdens de COVID-19-pandemie zijn veel gevallen van reukblindheid of anosmie gemeld. Het reukvermogen, dat meestal op de achtergrond komt te staan, is in het publieke bewustzijn gestegen. Bovendien heeft een onderzoeksproject, het Pyrfume Project, steeds grotere datasets openbaar beschikbaar gemaakt.

Het ruikt diep

In 2019 waren de grootste datasets gegroeid van minder dan 500 moleculen in de DREAM-uitdaging tot ongeveer 5.000 moleculen. Het onderzoeksteam van Google onder leiding van Alexander Wiltschko is er eindelijk in geslaagd de deep learning-revolutie naar de geur van machines te brengen. Hun model, gebaseerd op een soort diepgaand leren dat een grafenneuraal netwerk wordt genoemd, vormde de state-of-the-art op het gebied van machinegeur. Wiltschko is nu de oprichter en CEO van Osmo, wiens missie het is om ‘computers een reukvermogen te geven’.

Onlangs hebben Wiltschko en zijn team een ​​grafisch neuraal netwerk gebruikt om een ​​’primaire geurkaart’ te maken, waarbij perceptueel vergelijkbare geuren zich dichter bij elkaar bevinden dan ongelijksoortige geuren. Dit was niet eenvoudig: kleine veranderingen in de moleculaire structuur kunnen leiden tot grote veranderingen in de reukwaarneming. Omgekeerd kunnen twee moleculen met zeer verschillende moleculaire structuren nog steeds vrijwel hetzelfde ruiken.

Dergelijke vooruitgang bij het doorbreken van de geurcode is niet alleen intellectueel opwindend, maar heeft ook veelbelovende toepassingen, waaronder gepersonaliseerde parfums en geuren, betere insectenwerende middelen, nieuwe chemische sensoren, vroege ziektedetectie en meer realistische augmented reality-ervaringen. De toekomst van machinegeur ziet er rooskleurig uit. Het belooft ook lekker te ruiken.