Nasir Ahmed is een pionier op het gebied van digitale compressie-algoritmen

Sta even stil en denk eens aan internet zonder digitale beelden of video. Er zou geen gezicht op Facebook te vinden zijn. Instagram en TikTok zouden waarschijnlijk niet bestaan. Die Zoom-vergaderingen die tijdens het hoogtepunt van de COVID-19-pandemie de persoonlijke bijeenkomsten voor school of werk vervingen? Geen optie.

De plaats van digitale audio in onze met internet verbonden wereld is net zo belangrijk als foto’s en video. Het heeft de muziekwereld veranderd – van de productie tot de distributie en de manier waarop fans hun favoriete nummers kopen, verzamelen en opslaan.

Wat hebben die miljoenen profielen op LinkedIn, datingapps en sociale netwerken (en de eindeloze selectie muziek die online te downloaden is) met elkaar gemeen? Ze vertrouwen op een compressie-algoritme genaamd de Discrete Cosine Transform, of DCT, dat een belangrijke rol heeft gespeeld bij het mogelijk maken van de overdracht van digitale bestanden via computernetwerken.

“DCT is al meer dan dertig jaar een van de belangrijkste componenten van veel algoritmen voor beeld- en videocodering uit het verleden”, zegt Touradj Ebrahimi, professor aan de Ecole Polytechnique Fédérale de Lausanne in Zwitserland, die momenteel voorzitter is van de JPEG-standaardisatiecommissie. “Tegenwoordig zijn er slechts een paar standaarden voor beeldcompressie die geen gebruik maken van DCT”, voegt hij eraan toe.

Internettoepassingen die mensen dagelijks gebruiken, maar meestal als vanzelfsprekend beschouwen, zijn mogelijk gemaakt door wetenschappers en ingenieurs die voor het grootste deel anoniem probeerden te blijven. Eén van die ‘verborgen figuren’ is Nasir Ahmed, een Indiaas-Amerikaanse ingenieur die een elegante manier heeft bedacht om de bestandsgrootte van digitale afbeeldingen te verkleinen zonder de meest kritische visuele details op te offeren.

Ahmed publiceerde zijn baanbrekende artikel over het compressie-algoritme voor discrete cosinustransformatie dat hij in 1974 had uitgevonden, in een tijd waarin het nieuwe internet puur op inbelverbindingen en op tekst gebaseerd was. Er waren geen plaatjes bij die woorden, en dat kon ook niet zo zijn, omdat internetgegevens werden verzonden via standaard koperen vaste telefoonlijnen, wat een grote beperking in snelheid en bandbreedte betekende.

“Tegenwoordig zijn er slechts een paar standaarden voor beeldcompressie die geen gebruik maken van DCT,” –Touradj Ebrahimi, EPFL

Dankzij supersnelle chips en glasvezelnetwerken bereiken de downloadsnelheden voor een glasvezellaptop tegenwoordig 1 gigabit per seconde. Een muziekliefhebber kan dus binnen een seconde of twee een nummer van vier minuten downloaden naar zijn laptop (of waarschijnlijk smartphone). In het inbeltijdperk, toen de downloadsnelheden van internetgebruikers 56 kilobits per seconde bereikten (en meestal slechts de helft daarvan), duurde het downloaden van hetzelfde nummer van een server bijna een hele dag. Het plaatsen van een afbeelding op een computerscherm leek op het kijken naar gras dat groeit.

Ahmed was ervan overtuigd dat er een manier moest zijn om de omvang van digitale bestanden te verkleinen en het proces te versnellen. Hij ging op zoek om met enen en nullen weer te geven wat cruciaal was voor de leesbaarheid van het beeld, terwijl hij de minder belangrijke delen verwierp. Het duurde enige tijd voordat het antwoord duidelijk werd, gebaseerd op eerder werk van wiskundige en informatietheorie-pionier Claude Shannon. Maar vanwege Ahmeds vastberadenheid en onwankelbare geloof in de waarde van wat hij deed, bleef hij volharden, zelfs nadat hij van anderen had gehoord dat het de moeite niet waard was.

Opgegroeid met liefde voor technologie

Het leek bijna voorbestemd dat Ahmed een carrière zou hebben in een van de STEM-gebieden. Nasir, geboren in 1940 in Bengaluru, India, werd opgevoed door zijn grootouders van moederskant. Ahmeds grootvader was een elektrotechnisch ingenieur die hem vertelde dat hij in 1919 naar de Verenigde Staten werd gestuurd om te werken op de General Electric-fabriek in Schenectady, New York. Hij deelde verhalen over zijn tijd in de VS met zijn kleinzoon en moedigde de jonge Nasir aan om daarheen te emigreren toen het tijd was om zijn studie voort te zetten nadat hij in 1961 afstudeerde met een graad in elektrotechniek aan het Visvesvaraya College of Engineering in Bengaluru. Nasir verliet India die herfst voor een graduate studie aan de Universiteit van New Mexico in Albuquerque. Ahmed heeft een masterdiploma en een Ph.D. in elektrotechniek in respectievelijk 1963 en 1966.

Tijdens zijn eerste jaar in Albuquerque ontmoette hij Esther Parente, een afgestudeerde studente uit Argentinië. Ze werden al snel onafscheidelijk en trouwden terwijl hij aan zijn Ph.D. Zestig jaar later zijn ze nog steeds samen.

Het zaad van een idee

In 1966 werd Ahmed, net afgestudeerd en gepromoveerd, aangenomen als hoofdonderzoeker bij de nieuw opgerichte computerdivisie van Honeywell. Terwijl hij daar was, werd Ahmed voor het eerst blootgesteld aan Walsh-functies, een techniek voor het analyseren van digitale representaties van analoge signalen. Hoewel de snelle algoritmen die op basis van Walsh-functies konden worden gemaakt veel potentiële toepassingen hadden, was Ahmed gefocust op het gebruik van deze signaalverwerkings- en analysetechnieken om de bestandsgrootte van een digitaal beeld te verkleinen zonder al te veel visuele details te verliezen die zich in de ongecomprimeerde vorm bevonden. versie.

Die onderzoeksfocus bleef zijn voornaamste interesse toen hij terugkeerde naar de academische wereld en in 1968 hoogleraar werd aan de afdeling Electrical and Computer Engineering aan de Kansas State University.

Ahmed was, net als tientallen andere onderzoekers over de hele wereld, geobsedeerd door het vinden van het antwoord op één enkele vraag: hoe je een wiskundige formule kunt maken om te ontcijferen welke enen en nullen in de binaire code die een digitaal beeld vertegenwoordigt, moeten worden bewaard en welke kunnen worden weggegooid. weg? De dingen die hij bij Honeywell leerde, gaven hem een ​​raamwerk om de elementen van het probleem te begrijpen en hoe het aan te pakken. Maar het grootste deel van de eer voor de uiteindelijke doorbraak moet gaan naar Ahmeds ijzersterke vastberadenheid en bereidheid om te gokken.

In 1972 vroeg hij een beurs aan waarmee hij de maanden tussen het lente- en herfstsemester in Kansas State kon doorbrengen om zijn ideeën te ontwikkelen. Hij vroeg een subsidie ​​aan bij de Amerikaanse National Science Foundation, maar werd afgewezen. Ahmed herinnert zich dat moment als volgt: “Ik had een sterke intuïtie dat ik een efficiënte manier kon vinden om digitale signaalgegevens te comprimeren. Maar tot mijn verbazing zeiden de recensenten dat het idee te simpel was, dus verwierpen ze het voorstel.”

Onverschrokken benaderde Ahmed zijn vrouw over het verdienen van het salaris dat hij tijdens het negen maanden durende schooljaar in de zomer verdiende, zodat hij zich op zijn onderzoek kon concentreren. Het echtpaar herinnerde zich dat het geld krap was, maar dat moment van financiële krapte leek Ahmeds ijver alleen maar te vergroten. Ze hielden vol, en Ahmeds lange dagen en late nachten in het laboratorium wierpen uiteindelijk hun vruchten af.

DCT-compressie komt langs

Ahmed combineerde een techniek voor het omzetten van een reeks beeldverwerkingsgegevens die de pixels van een afbeelding vertegenwoordigen in een golfvorm, waardoor deze effectief wordt weergegeven als een reeks golven met oscillerende frequenties, met cosinusfuncties die al worden gebruikt om verschijnselen zoals lichtgolven, geluidsgolven, te modelleren. en elektrische stroom. Het resultaat was een lange reeks getallen met waarden begrensd door 1 en -1. Ahmed realiseerde zich dat door deze reeks waarden te kwantiseren en een Fourier-transformatie uit te voeren om de functie op te splitsen in de samenstellende frequenties, de gegevens van elke pixel werden weergegeven op een manier die nuttig was bij het beslissen welke datapunten moesten worden behouden en welke konden worden behouden. weggelaten. Ahmed merkte op dat golven met een lagere frequentie overeenkomen met essentiële of “hoge informatie”-gebieden van een beeld, terwijl golven met een hogere frequentie bits vertegenwoordigen die minder belangrijk zijn en daarom kunnen worden benaderd. De gecomprimeerde afbeeldingsbestanden die hij en zijn team maakten, waren een tiende van de grootte van de originelen. Bovendien zou het proces kunnen worden omgekeerd en zou het samengevoegde gegevensbestand een afbeelding opleveren die voldoende op het origineel leek.

Na nog twee jaar van nauwgezet testen, waarbij hij en zijn twee medewerkers computerprogramma’s draaiden die op een pak ponskaarten waren geschreven, publiceerde het trio het werk in IEEE-transacties op computers getiteld “Discrete Cosine Transform” in januari 1974. Hoewel de publicatie van dit artikel dit niet onmiddellijk duidelijk maakte, was de wereldwijde zoektocht naar een betrouwbare methode voor compressie met verlies, die Claude Shannon in de jaren veertig had verondersteld, voorbij.

JPEG, MPEG en meer

Pas in 1983 begon de Internationale Organisatie voor Standaardisatie (ISO) te werken aan technologie waarmee afbeeldingen van fotokwaliteit de tekst op computerterminalschermen konden begeleiden. Met dit doel voor ogen heeft ISO de Joint Photographic Experts Group opgericht, beter bekend onder de alomtegenwoordige afkorting JPEG. Tegen de tijd dat de eerste JPEG-standaard in 1992 werd gepubliceerd, erkende de groep DCT en de vooruitgang die door een groep andere onderzoekers was geboekt als de kernelementen van hun methode voor digitale compressie en codering van stilstaande beelden. “Dit is het mooie van standaardisatie, waarbij enkele tientallen knappe koppen achter het succes van ontwikkelingen als JPEG zitten”, zegt Ebrahimi.

En omdat een video omschreven kan worden als een serie foto’s, was de techniek van Ahmed ook geschikt voor het verkleinen van videobestanden. DCT was de compressietechniek bij uitstek toen ISO en de Internationale Elektrotechnische Commissie (IEC) in 1988 de Moving Image of MPEG Expert Group voor de compressie en codering van audio-, video-, grafische en genomische gegevens oprichtten. Toen de eerste MPEG-standaard in 1993 werd gepubliceerd, bestond het World Wide Web, dat nu Google Maps, dating-apps en e-commerce bevat, nog maar vier jaar oud.

De toename van de computersnelheid en de netwerkbandbreedte gedurende dat decennium – samen met de mogelijkheid om afbeeldingen en video via veel kleinere bestanden over te dragen – heeft het internet snel getransformeerd voordat iemand wist dat Amazon lezers uiteindelijk miljoenen boeken zou laten beoordelen op hun omslag.

Nadat hij het probleem had opgelost dat jarenlang zijn tijd en aandacht had gemonopoliseerd, ging Ahmed verder met de rest van zijn academische carrière. In 1993, het jaar waarin de eerste MPEG-standaard in de boeken werd gezet, verliet Ahmed de staat Kansas en keerde terug naar Albuquerque. Hij nam een ​​baan aan bij zijn alma mater als presidentieel hoogleraar elektrotechniek en computerwetenschappen. Hij vervulde die rol aan de Universiteit van New Mexico tot 1989, toen hij werd gepromoveerd tot voorzitter van de ECE-afdeling. Vijf jaar later werd hij decaan van de Technische School van UNM. Ahmed bekleedde die functie twee jaar totdat hij werd benoemd tot Associate Vice Chancellor for Research en Dean of Graduate Studies. Hij bleef in die functie tot aan zijn pensionering aan de universiteit in 2001 en werd tot emeritus hoogleraar verklaard.

Uit artikelen op uw website

Gerelateerde artikelen op internet