Duitsland ontwikkelt een nieuw onderzoeksinstrument – DW – 12.08.2024

Iedereen die Duitse archieven van vóór de Tweede Wereldoorlog serieus wil onderzoeken, heeft een speciale vaardigheid nodig: ze moeten manuscriptformulieren kunnen lezen die sindsdien volledig uit het dagelijks gebruik in de Duitse taal zijn verdwenen.

Er is Kurrent, een vorm van cursief schrift die zich in de late middeleeuwen ontwikkelde, evenals verschillende variantvormen, met name de kortstondige Sütterlin. Dit cursieve schrift werd in 1911 ontwikkeld en werd van 1915 tot 1941 op Duitse scholen onderwezen, totdat de nazi’s het verboden. Later gaven schoolkinderen er de voorkeur aan om handschrift te leren dat leek op het hedendaagse Engelse cursief.

Hoewel Duitstaligen die met Sütterlin zijn opgegroeid het in de naoorlogse periode bleven gebruiken, kunnen de meeste Duitsers geen brieven lezen die door hun grootouders zijn geschreven.

Maar nu kan een AI-programma precies dat doen.

Het Duitse federale archief (Bundesarchiv) heeft een nieuw hulpmiddel ontwikkeld om de verschillende soorten schrift in documenten uit het koloniale tijdperk te helpen decoderen.

Een ansichtkaart met een zwart-witfoto van traditionele Afrikaanse hutten, bedekt met een handgeschreven briefje in Kurrent.
De meeste Duitsers zouden het handschrift van Kurrent op deze ansichtkaart uit 1903 moeilijk kunnen ontcijferen.Afbeelding: alliantie akg-images/image

Een belangrijke collectie waar nog aan gewerkt moet worden

Documenten uit deze tijd waren bijzonder interessant voor een dergelijk project, omdat het Duitse Federale Archief een verzameling van ongeveer 10.000 dossiers bezit van het Reichskoloniale Bureau, dat de centrale autoriteit was voor het koloniale beleid van het Duitse Rijk.

Ze werden “geselecteerd omdat de meeste met de hand geschreven waren”, vertelde archiefwoordvoerder Elmar Kramer aan DW. Voor het pilotprogramma is ook voor deze collectie gekozen omdat de bestanden van het Reichskoloniebureau al volledig gedigitaliseerd zijn en geen gebruiksbeperkingen meer kennen, legt projectleider Inger Banse uit.

Maar het allerbelangrijkste, zoals hij opmerkt, is dat “de verzoening met het koloniale tijdperk de focus is van onze hele samenleving en met deze collectie kunnen we daar een goede bijdrage aan leveren”.

“Te lang zijn de misdaden uit het Duitse koloniale tijdperk een blinde vlek geweest in onze herinneringscultuur”, zei de Duitse cultuur- en mediacommissaris Claudia Roth, die het project van het Federaal Archief verwelkomde om speciaal ontwikkelde AI-technologie te gebruiken “om de kennis te helpen versterken van dit donkere hoofdstuk uit de Duitse geschiedenis en levert daarmee een belangrijke bijdrage aan de omgang met het verleden.

Zwart-witfoto van Afrikanen die graven naar blanke kolonialisten.
De lokale bevolking werd gedwongen te werken voor de kolonialisten in Duits Oost-Afrika (het huidige Burundi, Rwanda en het vasteland van Tanzania)Afbeelding: alliantie akg-images/image

De eerste genocide in de 20e eeuw

De kolonisatie door het Duitse rijk begon aan het einde van de 19e eeuw en was vooral gericht op het overnemen van gebieden en het vestigen van koloniën in Afrika, de Stille Zuidzee en China.

Het Duitse koloniale rijk duurde slechts dertig jaar – van 1884 tot het einde van de Eerste Wereldoorlog – maar kort nadat het was gevestigd, werd het het derde grootste koloniale rijk, na Groot-Brittannië en Frankrijk. En het koloniale bewind was bijzonder wreed.

Gedocumenteerd in de collectie van het Federaal Archiefzijn donkere hoofdstukken over de Sokehs-opstand van 1910/1911. die begon op het eiland Sokehs voor het hoofdeiland Pohnpei op de Oost-Carolina-eilanden, tegenwoordig de Federale Staten van Micronesië. Als gevolg daarvan pasten de Duitse koloniale heersers een beleid van verschroeide aarde toe om de rebellen op te sporen en de stam van hun eigen eiland in de Zuidzee te laten deporteren.

Een ander prominent geval van koloniaal onrecht is de manier waarop koning Rudolf Douala Manga Bell en Adolf Ngoso Din in 1914 werden geëxecuteerd omdat ze vreedzaam campagne voerden tegen de maatregelen van het Duitse koloniale bestuur om de Douala-bevolking te verwijderen en te hervestigen uit hun huizen in de kust- en zuidwestelijke regio’s van Kameroen. .

Het meest berucht is dat hij verantwoordelijk was voor de genocide op Herero en Nama, bekend als de eerste genocide van de 20e eeuw. Dit vond plaats van 1904 tot 1908, nadat de Herero- en Nama-bevolking in opstand kwamen tegen hun Duitse koloniale heersers.

Pas in 2021 gaf Duitsland officieel toe dat het genocide had gepleegd tijdens de koloniale bezetting van wat nu Namibië is.

Oude illustratie uit het Duitse koloniale tijdperk: mannen in uniform die schedels in een doos stoppen.
Deze foto toont Herero-schedels die worden verpakt en naar het Instituut voor Pathologie in Berlijn worden gestuurdAfbeelding: alliantie akg-images/image

Early adopters van AI

Datzelfde jaar begon het Federaal Archief met de ontwikkeling van een AI-tool om de archieven uit het koloniale tijdperk toegankelijker te maken. Dit was voordat het zogenaamde nieuwe tijdperk van AI begon, toen ChatGPT en andere belangrijke taalmodellen openbaar werden gemaakt, waardoor kunstmatige intelligentie een alomtegenwoordig onderwerp van discussie werd.

“Wij vinden het belangrijk om altijd deel uit te maken van de laatste ontwikkelingen”, vertelt Elmar Kramer over de voortrekkersrol van het Federaal Archief op dit gebied. “Daarom is AI al enkele jaren een onderwerp voor ons. In dit geval kunnen we zeggen dat we nu een van onze oudste holdings en een van de nieuwste technologieën samenbrengen, als je wilt: AI ontmoet kolonialisme.”

Opgemerkt moet worden dat de AI niet alleen Sütterlin moet kunnen decoderen, maar ook soms “behoorlijk rommelig, gekrabbeld schrift”, benadrukt Kramer. Naast “ander handschrift in het algemeen, hebben we ook gedrukt en getypt materiaal. Er zijn veel kruisingen, maar er zijn ook zeer schone pagina’s”, voegt Inger Banse toe, en daarom hebben ze de documenten in drie verschillende categorieën verdeeld, volgens aan de complexiteit van het materiaal op de pagina.

Een screenshot van een computerprogramma met aan de rechterkant een handgeschreven document en aan de andere kant een transcriptie.
Een voorbeeld van een document geschreven in Sütterlin en getranscribeerd met behulp van een AI-tool ontwikkeld door het Federaal ArchiefAfbeelding: BArch/R 1001/5573/Image165/Bundesarchiv

“We hebben gekeken hoe het model presteerde in deze verschillende categorieën”, legt Banse uit. Ze trainden het model door de AI-transcriptieresultaten van ongeveer 170 pagina’s met verschillend materiaal handmatig regel voor regel te controleren en te verbeteren.

Banse zegt dat ze nu een punt hebben bereikt waarop het AI-model een acceptabele nauwkeurigheid biedt in de transcripties van zelfs het meest complexe materiaal.

Het bereiken van perfectie bij transcriptie zou een onevenredige tijdsinvestering vergen, zegt Banse, daarbij verwijzend naar het Pareto-principe dat de moeilijkste 20% van het optimalisatieproces 80% van de inspanning vergt. “Dus op een gegeven moment moesten we een grens trekken”, legt ze uit. In plaats daarvan gaven ze er de voorkeur aan een mildere zoekmachine te ontwikkelen waarmee een breder scala aan resultaten kon worden verkregen.

En nu het AI-model van het Federaal Archief is getraind om Kurrent te decoderen, opent het een heel veld aan mogelijkheden voor andere Duitstalige archieven. Momenteel is het echter nog een pilotproject dat speciaal voor deze collectie is ontworpen. Het kan ter plaatse worden geraadpleegd in de onderzoekszaal van het archief in Berlijn-Lichterfelde en zal binnenkort online beschikbaar zijn.

Bewerkt door Brenda Haas