Een zoekopdracht voor het typen van Chinees op een QWERTY-toetsenbord zorgde voor automatisch aanvullen

Als Huang Zhenyu’s beheersing van complexe alfanumerieke code nog niet indrukwekkend genoeg was, kijk dan eens naar de verbazingwekkende snelheid van zijn optreden. Hij transcribeerde de eerste 31 Chinese karakters uit de toespraak van Hu Jintao in ongeveer 5 seconden, een geëxtrapoleerde snelheid van 372 Chinese karakters per minuut. Tegen het einde van de slopende wedstrijd van 20 minuten, die duizenden karakters omvatte, was hij met een bijna ongelooflijke snelheid van 221,9 karakters per minuut over de finish gekomen.

Dat zijn 3,7 Chinese karakters per seconde.

In de context van de Engelse taal zouden de eerste 5 seconden van Huang overeenkomen met ongeveer 375 Engelse woorden per minuut, waarbij zijn algehele wedstrijdsnelheid gemakkelijk de 200 WPM zou overschrijden – een ongelooflijk tempo dat door niemand in de Engelstalige wereld wordt geëvenaard (tenminste met gebruik van QWERTY) . In 1985 behaalde Barbara Blackburn een Guinness Book of Wereldrecords– geverifieerde prestatie van 170 Engelse woorden per minuut (op een typemachine, niet minder). Snelheidsduivel Sean Wrona overtrof later de score van Blackburn met een prestatie van 174 WPM (op een computertoetsenbord moet worden opgemerkt). Hoe indrukwekkend deze mijlpalen ook zijn, het feit blijft: als Huangs optreden in de Engelstalige wereld had plaatsgevonden, zou zijn naam zijn ingeschreven in Guinness Book of Wereldrecords als een nieuwe benchmark om te verslaan.

Huangs snelheid had ook een bijzondere historische betekenis.

Voor iemand die tussen 1850 en 1950 leeft: de periode die in het boek wordt behandeld Chinese typemachine– het idee om Chinees met mechanische middelen te produceren met een snelheid van meer dan tweehonderd tekens per minuut zou vrijwel ondenkbaar zijn. Gedurende de hele geschiedenis van de Chinese telegrafie, die teruggaat tot de jaren 1870, hadden operators een maximale snelheid van misschien enkele tientallen tekens per minuut. Tijdens de hoogtijdagen van het mechanische Chinese typen, van de jaren twintig tot de jaren zeventig, waren de hoogste geregistreerde snelheden iets minder dan tachtig tekens per minuut (waarbij de meeste typisten op veel lagere snelheden werkten). In termen van moderne informatietechnologie is het Chinees consequent een van de langzaamste schrijfsystemen ter wereld geweest.

Wat is er veranderd? Hoe kon een script dat zo lang in diskrediet werd gebracht als log en hulpeloos complex, plotseling de typesnelheden in andere delen van de wereld evenaren (en zelfs overtreffen)? Zelfs als we accepteren dat Chinese computergebruikers op de een of andere manier in staat zijn om “real-time” te coderen, zou Chinese IME dan niet moeten resulteren in een lager algemeen “plafond” voor het verwerken van Chinese tekst vergeleken met Engels? Chinese computergebruikers moeten immers door zoveel meer hoepels springen tijdens een omslachtig proces dat uit meerdere stappen bestaat: de IME moet de toetsaanslagen van de gebruiker onderscheppen, het geheugen doorzoeken op een match, potentiële kandidaten presenteren en wachten op de bevestiging van de gebruiker. Ondertussen hoeven Engelstalige computergebruikers alleen maar op de toets te drukken die ze op het scherm willen zien. Wat is er eenvoudiger dan de ‘directheid’ van ‘Q is gelijk aan Q’, ‘W is gelijk aan W’ enzovoort?

Om deze schijnbare paradox te ontrafelen, onderzoeken we de eerste Chinese computer die ooit is ontworpen: het Sinotype, ook wel bekend als de Ideographic Typesetting Machine. Deze machine, die in 1959 werd geïntroduceerd door MIT-professor Samuel Hawks Caldwell en de Graphics Research Foundation, had een QWERTY-toetsenbord, dat de operator gebruikte om in te voeren – niet de fonetische waarden van Chinese karakters – maar de penseelstreken waaruit Chinese karakters bestaan. Het doel van Sinotype was niet om Chinese karakters op een pagina te “bouwen”, maar eerder de manier waarop een gebruiker Engelse woorden opbouwt door achtereenvolgens letters toe te voegen. In plaats daarvan diende elke streek als een elektronisch adres dat de logica van Sinotype gebruikte om het Chinese karakter uit het geheugen op te halen. Met andere woorden: de allereerste computer van China was gebaseerd op hetzelfde soort ‘extra stappen’ als in Huang Zhenyu’s bekroonde optreden uit 2013.

Tijdens Caldwells onderzoek ontdekte hij de onverwachte voordelen van al deze extra stappen; voordelen die destijds volkomen ongehoord waren in de context van de Engelstalige mens-machine-interactie. Hij ontdekte dat het Sinotype veel minder toetsaanslagen vereiste vinden Chinees karakter in het geheugen dan ja componeren één via conventionele inschrijvingsmiddelen. Op analoge wijze duurde het veel langer om een woord van negen letters, zoals ‘krokodil’ (krokodil), te ‘spellen’ dan om hetzelfde woord uit het geheugen op te halen (‘krokodil’ zou immers voldoende zijn voor de computer om een ondubbelzinnige overeenkomst te maken. gezien de afwezigheid van andere woorden met een vergelijkbare of identieke spelling). Caldwell noemde zijn ontdekking ‘minimale spelling’, waardoor het een belangrijk onderdeel werd van de eerste Chinese computer die ooit werd gebouwd.

Tegenwoordig kennen we deze techniek onder een andere naam: ‘autocompletion’, een strategie voor interactie tussen mens en computer waarbij extra bemiddelingslagen resulteren in snellere tekstinvoer dan het ‘ongemedieerde’ typen. Tientallen jaren vóór de herontdekking ervan in de Engelstalige wereld werd automatisch aanvullen voor het eerst uitgevonden in de arena van de Chinese computertechnologie.