Een nieuwe openbare database somt alle manieren op waarop AI fout kan gaan

Deze bevindingen kunnen implicaties hebben voor de manier waarop we AI evalueren, omdat we momenteel de neiging hebben om ervoor te zorgen dat het model veilig is voordat het wordt gelanceerd. “Wat onze database zegt is dat het scala aan risico’s breed is en dat ze niet allemaal vooraf kunnen worden gecontroleerd”, zegt Neil Thompson, directeur van MIT FutureTech en een van de makers van de database. Daarom willen auditors, beleidsmakers en laboratoriumwetenschappers modellen mogelijk monitoren nadat ze zijn gelanceerd, door regelmatig de risico’s te beoordelen die ze na implementatie met zich meebrengen.

Er zijn in het verleden veel pogingen ondernomen om een ​​dergelijke lijst samen te stellen, maar die hadden vooral betrekking op een beperkte reeks potentiële schade die voortvloeit uit AI, zegt Thompson, en de fragmentarische aanpak maakte het moeilijk om een ​​alomvattend beeld van de risico’s te krijgen. verbonden met AI.

Zelfs met deze nieuwe database is het moeilijk om te weten over welke AI we ons het meeste zorgen moeten maken, een taak die nog ingewikkelder wordt gemaakt door het feit dat we niet volledig begrijpen hoe geavanceerde AI-systemen überhaupt werken.

De makers van de database hebben dit probleem omzeild en ervoor gekozen om risico’s niet te rangschikken op basis van het gevaarniveau dat ze opleveren.

“Wat we echt wilden was een neutrale en uitgebreide database, en met neutraal bedoel ik alles zoals gepresenteerd en er heel transparant over zijn”, zegt de hoofdauteur van de database, Peter Slattery, een postdoctoraal onderzoeker bij MIT FutureTech.

Maar die tactiek zou het nut van de database kunnen beperken, zegt Anka Reuel, een PhD-student computerwetenschappen aan Stanford University en lid van het Center for AI Security, die niet bij het project betrokken was. Ze zegt dat alleen het in kaart brengen van de risico’s die met AI gepaard gaan, binnenkort onvoldoende zal zijn. “Ze waren zeer grondig, wat een goed startpunt is voor toekomstige onderzoeksinspanningen, maar ik denk dat we op een punt komen waarop het bewust maken van mensen van alle risico’s niet langer het belangrijkste probleem is”, zegt ze. “Voor mij is het de vertaling van die risico’s. Wat moeten we eigenlijk doen om terug te vechten? [them]?”

Deze database opent de deur voor toekomstig onderzoek. De makers hebben de lijst gedeeltelijk opgesteld om hun zorgen te onderzoeken, zoals welke risico’s te weinig worden onderzocht of niet worden aangepakt. “Waar we ons het meest zorgen over maken, is of er hiaten zijn?”, zegt Thompson.

“Het is onze bedoeling dat dit een levende database wordt, het begin van iets. We willen hier graag feedback op krijgen”, zegt Slattery. “We hebben dit niet naar buiten gebracht door te zeggen: ‘We hebben het echt, en alles wat we hebben gedaan zal perfect zijn.'”