Wat is een AI-agent precies?

AI-agenten zouden het volgende grote ding in AI moeten zijn, maar er bestaat geen exacte definitie van wat ze zijn. Tot nu toe zijn mensen het er niet eens over wat een AI-agent precies is.

In de eenvoudigste bewoordingen kan een AI-agent het beste worden omschreven als op kunstmatige intelligentie gebaseerde software die een aantal taken voor u uitvoert die in het verleden konden worden uitgevoerd door een menselijke klantenservicemedewerker, HR-persoon of IT-helpdeskmedewerker. kan uiteindelijk elke taak omvatten. Je vraagt hem om dingen te doen, en hij doet ze voor je, waarbij hij soms meerdere systemen doorkruist en verder gaat dan alleen het beantwoorden van vragen.

Lijkt eenvoudig genoeg, toch? Het wordt echter bemoeilijkt door een gebrek aan duidelijkheid. Zelfs onder de technologiegiganten bestaat er geen consensus. Google beschouwt ze als taakgebaseerde assistenten, afhankelijk van de taak: codeerhulp voor ontwikkelaars; detailhandelaren helpen bij het creëren van een kleurenschema; een IT-professional helpen problemen te vinden door loggegevens op te vragen.

Voor Asana kan een agent als extra medewerker optreden en de toegewezen taken uitvoeren zoals elke goede collega. Sierra, een startup opgericht door voormalig Salesforce-CEO Bret Taylor en Google-dierenarts Clay Bavor, beschouwt agents als tools voor gebruikerservaring, die mensen helpen acties te volbrengen die veel verder gaan dan de chatbots van weleer en helpen bij het oplossen van complexere problemen.

Dit gebrek aan een samenhangende definitie laat ruimte voor verwarring over wat deze dingen precies zullen doen, maar ongeacht hoe ze worden gedefinieerd, agenten zijn bedoeld om te helpen taken op een geautomatiseerde manier uit te voeren met zo min mogelijk menselijke interactie.

Rudina Seseri, oprichter en managing partner bij Glasswing Ventures, zegt dat het nog in de kinderschoenen staat en dat dit het gebrek aan deals zou kunnen verklaren. “Er bestaat geen eenduidige definitie van wat een ‘AI-agent’ is. De meest voorkomende opvatting is echter dat een agent een intelligent softwaresysteem is dat is ontworpen om zijn omgeving waar te nemen, erover na te denken, beslissingen te nemen en acties te ondernemen om autonoom specifieke doelen te bereiken”, vertelde Seseri aan TechCrunch.

Ze zegt dat ze een aantal AI-technologieën gebruiken om dit mogelijk te maken. “Deze systemen omvatten verschillende AI/ML-technieken zoals natuurlijke taalverwerking, machinaal leren en computervisie om in dynamische domeinen te kunnen opereren, autonoom of samen met andere agenten en menselijke gebruikers.”

Aaron Levie, mede-oprichter en CEO van Box, zegt dat AI-agenten in de loop van de tijd, naarmate AI capabeler wordt, veel meer kunnen doen ten behoeve van de mens, en dat er al een dynamiek bestaat die die evolutie zal aandrijven.

“Bij AI-agents zijn er meerdere componenten voor het zelfversterkende vliegwiel die zullen dienen om dramatisch te verbeteren wat AI-agents op de korte en lange termijn kunnen bereiken: GPU-kosten/-prestaties, modelefficiëntie, modelkwaliteit en intelligentie, AI-frameworks, en verbeteringen aan de infrastructuur”, schreef hij onlangs aan Levie op LinkedIn.

Het is een optimistische visie op technologie die ervan uitgaat dat er op al deze gebieden groei zal plaatsvinden, terwijl dat niet noodzakelijkerwijs een gegeven is. MIT-roboticapionier Rodney Brooks wees er in een recent interview met TechCrunch op dat AI met veel moeilijkere problemen te maken heeft dan de meeste technologie en niet noodzakelijkerwijs op dezelfde snelle manier zal groeien als bijvoorbeeld Moore’s Law-chips.

“Wanneer een mens een AI-systeem een taak ziet uitvoeren, generaliseren ze deze onmiddellijk naar dingen die vergelijkbaar zijn en evalueren ze de competenties van het AI-systeem; niet alleen de prestaties, maar ook de competentie eromheen”, zei Brooks tijdens dat interview. “En ze zijn vaak erg optimistisch, en dat komt omdat ze een model gebruiken van iemands prestaties bij een taak.”

Het probleem is dat systemen tussen systemen moeilijk zijn, en dat wordt gecompliceerd door het feit dat sommige oudere systemen geen basistoegang tot de API hebben. Hoewel we de gestage verbeteringen zien waar Levie op doelde, zou het een grotere uitdaging kunnen blijken om de software toegang te geven tot meerdere systemen en tegelijkertijd de problemen aan te pakken die onderweg tegen kunnen komen, dan velen denken.

Als dat het geval is, zou iedereen kunnen overschatten wat AI-agenten zouden moeten kunnen doen. David Cushman, hoofd onderzoek bij HFS Research, ziet de huidige oogst van bots meer als Asana: assistenten die mensen helpen bepaalde taken uit te voeren in het belang van het bereiken van een soort strategisch doel dat door de gebruiker is gedefinieerd. De uitdaging is om de machine te helpen op een werkelijk geautomatiseerde manier met onvoorziene omstandigheden om te gaan, en daar zijn we duidelijk nog lang niet in de buurt.

“Ik denk dat dit de volgende stap is”, zei hij. “Het is waar AI onafhankelijk en efficiënt op schaal werkt. Dit is dus waar mensen richtlijnen opstellen, vangrails opstellen en meerdere technologieën toepassen om de mens buiten de cirkel te houden – terwijl het er allemaal om ging de mens in bedwang te houden. in knoeien met GenAI, ‘zei hij. Dus de sleutel hier, zei hij, is om de AI-agent het over te laten nemen en de juiste automatisering toe te passen.

Jon Turow, een partner bij Madrona Ventures, zegt dat hiervoor een AI-agentinfrastructuur nodig is, een technische stapel die speciaal is ontworpen voor het maken van agenten (hoe je ze ook definieert). In een recente blogpost schetste Turow voorbeelden van AI-agenten die momenteel in het wild werken en hoe ze vandaag de dag worden gebouwd.

Volgens Turow vereist de groeiende proliferatie van AI-agenten – en hij geeft ook toe dat de definitie nog steeds enigszins ongrijpbaar is – een technologiestapel zoals elke andere technologie. “Dit alles betekent dat onze industrie werk te doen heeft om de infrastructuur op te bouwen die AI-agenten ondersteunt en de applicaties die daarvan afhankelijk zijn”, schreef hij in de tekst.

“In de loop van de tijd zal het denken geleidelijk verbeteren, zullen grensmodellen grotere workflows aansturen, en zullen ontwikkelaars zich willen concentreren op producten en data – de dingen die hen onderscheiden. Ze willen dat het kernplatform ‘gewoon werkt’ met omvang, prestaties en betrouwbaarheid.”

Een ander ding om in gedachten te houden is dat er waarschijnlijk meerdere modellen nodig zijn, in plaats van één enkele LLM, om de agenten te laten werken, en dit is logisch als je deze agenten beschouwt als een verzameling verschillende taken. “Ik denk niet dat momenteel een groot taalmodel, althans een publiek beschikbaar, monolithisch groottaalmodel, in staat is om agenttaken uit te voeren. Ik denk nog steeds niet dat ik de meerstappenredenering kan uitvoeren die me echt enthousiast maakt over de toekomst van de agent. Ik denk dat we dichterbij komen, maar het is er nog niet”, zegt Fred Havemeyer, hoofd van het Amerikaanse AI- en softwareonderzoek bij Macquarie US Equity Research.

“Ik denk dat de meest efficiënte agenten waarschijnlijk meerdere verzamelingen van meerdere verschillende modellen zullen zijn met een routeringslaag die verzoeken of vragen naar de meest efficiënte agent en model stuurt. En ik denk dat dat interessant zou zijn [automated] toezichthouder, die een soort rol delegeert.”

Uiteindelijk werkt de industrie voor Havemeyer aan dit doel, waarbij agenten onafhankelijk werken. “Als ik nadenk over de toekomst van agenten, wil en hoop ik agenten te zien die echt autonoom zijn en in staat zijn om abstracte doelen te stellen en vervolgens alle individuele stappen daartussen volledig onafhankelijk te overwegen”, vertelde hij aan TechCrunch.

Maar feit is dat we ons nog steeds in een overgangsperiode bevinden als het gaat om deze middelen, en we weten niet wanneer we de eindtoestand zullen bereiken die Havemeyer heeft beschreven. Hoewel wat we tot nu toe hebben gezien duidelijk een veelbelovende stap in de goede richting is, hebben we nog steeds enkele verbeteringen en doorbraken nodig om AI-agenten te laten werken zoals ze vandaag de dag voor ogen zijn. En het is belangrijk om te begrijpen dat we er nog niet zijn.