AI en data-infrastructuur voeden de vraag naar open source startups

Nieuw rapport benadrukt de vraag naar startups die open source-tools en -technologieën bouwen voor de tumultueuze AI-revolutie, waarbij de aangrenzende verticale data-infrastructuur ook aan het opwarmen is.

Runa Capital, het durfkapitaalbedrijf dat de stokjes uit Silicon Valley heeft overgenomen en in 2022 zijn hoofdkantoor naar Luxemburg verhuist, heeft de afgelopen vier jaar de Runa Open Source Startup Index (ROSS) gepubliceerd, waarmee licht wordt geworpen op de snelst groeiende commerciële markt. open source software startups-code (COSS). Het bedrijf publiceert kwartaalupdates, maar vorig jaar produceerde het zijn eerste jaarverslag met een top-down overzicht van heel 2022 – iets wat het nu herhaalt voor 2023.

Trends

Gegevens zijn nauw verwant aan AI omdat AI afhankelijk is van gegevens om te leren en voorspellingen te doen, en dit vereist een infrastructuur om de verzameling, opslag en verwerking van die gegevens te beheren. En deze tangentiële trends botsten in dit rapport.

De eerste plaats in de ROSS-index van vorig jaar was LangChain, een twee jaar oude startup uit San Francisco die een open source-framework ontwikkelde voor het bouwen van applicaties op basis van grootschalige taalmodellen (LLM). Het hoofdproject van het bedrijf behaalde in 2023 72.500 sterren, en Sequoia leidde vorige maand nog een Series A-ronde van $ 25 miljoen in LangChain.

Top 10 COSS-startups in de ROSS-index voor 2023

Top 10 COSS-startups in de ROSS-index voor 2023 Afbeeldingscredits: Runa-hoofdstad

Elders in de top 10 staat Reflex, een open-sourceframework voor het maken van webapplicaties in pure Python, en het bedrijf achter het product heeft onlangs een investering van $ 5 miljoen binnengehaald; AITable, een op spreadsheets gebaseerde AI-chatbotbouwer en enigszins vergelijkbaar met open source concurrent Airtable; Sismo, een op privacy gericht platform waarmee gebruikers selectief persoonlijke informatie aan apps kunnen vrijgeven; HPC-AI, dat een gedistribueerd platform bouwt voor de ontwikkeling en inzet van AI in een poging om zoiets als de OpenAI van Zuidoost-Azië te worden; en open source vectordatabase Qdrant, die onlangs 28 miljoen dollar binnenhaalde om te profiteren van de groeiende AI-revolutie.

Een bredere blik op de ‘Top 50’ open source startups van het afgelopen jaar laat zien dat meer dan de helft (26) gerelateerd is aan AI en data-infrastructuur.

Top 50 COSS-startups in de ROSS-index voor 2023

Top 50 COSS-startups in de ROSS-index voor 2023 Afbeeldingscredits: Runa-hoofdstad

Het is moeilijk om de index van 2023 vanuit verticaal perspectief goed te vergelijken met het voorgaande jaar, vooral vanwege het feit dat bedrijven hun productpositionering vaak aanpassen of aanpassen aan wat vandaag de dag populair is. Nu de ChatGPT-hypetrein vorig jaar op volle toeren draaide, kan dit beginnende startups ertoe hebben aangezet hun focus te verleggen, of zelfs gewoon meer nadruk te leggen op het bestaande ‘AI’-element van hun product.

Maar aangezien dit een jaar van doorbraak is voor generatieve AI, is het gemakkelijk in te zien waarom de vraag naar open source-componenten omhoog zou kunnen schieten, aangezien bedrijven van elke omvang gelijke tred willen houden met propriëtaire AI-giganten als OpenAI, Microsoft en Google.

Geografie

Open source-software is ook altijd sterk gedistribueerd geweest, met bijdragen van ontwikkelaars over de hele wereld. Dit ethos vertaalt zich vaak in commerciële open source startups die misschien niet het traditionele zwaartepunt hebben dat verankerd is in een stabiel hoofdkantoor.

De ROSS Index brengt echter enigszins de geografie in beeld en rapporteert dat 26 bedrijven op de lijst in de VS zijn gevestigd, hoewel 10 van deze bedrijven elders zijn ontstaan ​​en nog steeds oprichters of werknemers hebben die op andere locaties zijn gevestigd.

In totaal komt de top 50 uit 17 afzonderlijke landen, met 23 bedrijven geregistreerd in Europa – een stijging van 20% ten opzichte van de index van vorig jaar. Frankrijk telde de meeste COSS-startups met zeven, waaronder Sismo en Massa in de top 10, terwijl Groot-Brittannië groeide van slechts één startup in 2022 naar zes in 2023, waarmee het vanuit Europees perspectief op de tweede plaats kwam.

Andere opmerkelijke weetjes die uit het rapport naar voren komen, zijn onder meer programmeertalen: de ROSS-index registreerde twaalf talen die vorig jaar door de top 50 werden gebruikt, tegen tien in 2022. Maar Typescript, een door Microsoft ontwikkelde JavaScript-superset, blijft het populairst. , gebruikt door 38% van de top 50 startups. Zowel Python als Rust zijn in populariteit gegroeid, terwijl Go en JavaScript zijn afgenomen.

ROSS-index: trending programmeertalen

ROSS-index: trending programmeertalen. Afbeeldingscredits: Runa-hoofdstad

De top 50 deelnemers aan de ROSS-index behaalden in 2023 gezamenlijk 12.000 bijdragers, terwijl het totale aantal GitHub-sterren met bijna 500.000 toenam. Uit de index blijkt ook dat de financiering voor de top 50 COSS-startups vorig jaar 513 miljoen dollar bedroeg, een stijging van 32% ten opzichte van 2022 en 145% ten opzichte van 2021.

De ROSS-index: bijdragers, sterren en financiering

De ROSS-index: bijdragers, sterren en financiering Afbeeldingscredits: Runa-hoofdstad

Methodologie en context

Het is de moeite waard om naar de methodologie achter dit alles te kijken: welke factoren spelen een rol bij de vraag of een bedrijf als ‘top trending’ wordt beschouwd? Om te beginnen: alle betrokken bedrijven moet minimaal 1.000 GitHub-sterren hebben (een GitHub-statistiek die lijkt op een ‘like’ op sociale media) om in aanmerking te komen. Maar het aantal sterren alleen vertelt ons niet veel over wat er trending is, aangezien sterren zich in de loop van de tijd ophopen – dus een project dat al tien jaar op GitHub staat, zal waarschijnlijk meer sterren verzamelen dan een project dat al tien maanden bestaat. In plaats daarvan meet Runa de relatieve groei van een ster over een bepaalde periode met behulp van de jaarlijkse groeisnelheid (AGR). Hierbij wordt gekeken naar de waarde van een ster nu vergeleken met de voorgaande overeenkomstige periode om te zien wat het meest indrukwekkend is gegroeid.

Er is hier sprake van een zekere mate van handmatig beheer, aangezien het doel specifiek is om open source ‘startups’ te lanceren – dus haalt Runa’s investeringsteam projecten tevoorschijn die behoren tot een ‘commerciële productgerichte organisatie’ en die minder dan tien jaar geleden opgericht moeten zijn. jaar geleden met minder dan 100 miljoen dollar aan bekende financiering.

Het definiëren van wat “open source” inhoudt, heeft ook zijn inherente uitdagingen, aangezien er een aantal manieren zijn waarop een startup “open source” is – sommige lijken meer op “open core”, waarbij de meeste van hun belangrijkste functies achter een premium betaalmuur zijn opgesloten. en sommige hebben licenties die restrictiever zijn dan andere. Hiervoor besloten de curatoren van Runa dat de startup simpelweg een product moest hebben dat ‘rgemakkelijk te koppelen aan de open repositories”, wat uiteraard een zekere mate van subjectiviteit met zich meebrengt bij het beslissen welke het halen.

Er spelen andere nuances. De ROSS Index hanteert een bijzonder liberale interpretatie van ‘open source’ – zowel Elastic als MongDB hebben bijvoorbeeld hun open source-roots verlaten voor ‘open source’-licenties om zichzelf te beschermen tegen misbruik door grote cloudproviders. Volgens de ROSS Index-methodologie zouden beide bedrijven in aanmerking komen als ‘open source’ – ook al zijn hun licenties niet formeel als zodanig goedgekeurd door het Open Source Initiative, en noemen deze specifieke voorbeeldbedrijven zichzelf niet langer ‘open source’.

Daarom gebruikt hij, volgens de methodologie van Runa, voor zijn rapport wat hij de ‘commerciële perceptie van open source’ noemt, in plaats van de daadwerkelijke licentie die het bedrijf aan zijn project koppelt. Dit betekent dat beperkte bronlicenties zoals de BSL (Business Source License) en SSPL (Server Side Public License), die MongoDB introduceerde als onderdeel van de transitie van open source in 2018, bij commerciële bedrijven heel vaak op het menu staan. in de ROSS-index.

“Dergelijke licenties behouden de geest van OSS – al zijn vrijheden, behalve een enigszins beperkte herverdeling, die geen gevolgen heeft voor ontwikkelaars, maar oorspronkelijke leveranciers een concurrentievoordeel op de lange termijn geeft”, legt Konstantin Vinogradov, algemeen partner van het in Londen gevestigde Runa Capital, uit. naar TechCrunch. “Vanuit een VC-perspectief is het slechts een geëvolueerd draaiboek voor precies hetzelfde soort bedrijven. De definitie van open source verwijst naar softwareproducten, niet naar bedrijven.”

Er zijn nog meer belangrijke filters. Bedrijven die zich vooral richten op het verlenen van professionele dienstverlening, of nevenprojecten met beperkte actieve ondersteuning of zonder commercieel element, zijn bijvoorbeeld niet opgenomen in de ROSS-index.

Voor vergelijkingsdoeleinden zijn er andere indexen en lijsten die richtlijnen geven over wat er populair is in de open source-omgeving. Een ander VC-bedrijf genaamd Two Sigma Ventures onderhoudt bijvoorbeeld een Open Source Index, die qua concept vergelijkbaar is met Runin, behalve dat deze alle soorten open source-projecten omvat (niet alleen startups) en extra filters heeft, waaronder de mogelijkheid om te bekijken GitHub’s statistieken “waarnemers”, waarvan sommigen beweren dat ze een nauwkeuriger beeld geven van de werkelijke populariteit van het project.

GitHub publiceert zelf ook een trending repository-pagina, die zich, net als Two Sigma Ventures, niet richt op de business achter het project.

Zo is de ROSS-index naar voren gekomen als een nuttig aanvullend instrument om te ontdekken welke open source ‘startups’ vooral de moeite waard zijn om te volgen.