De nieuwste bug van OpenAI laat de uitdagingen zien waarmee de Chinese AI-modellen worden geconfronteerd

De nieuwste bug van OpenAI laat de uitdagingen zien waarmee de Chinese AI-modellen worden geconfronteerd

Onder de weinige lange Chinese tokens in GPT-4o die noch pornografie noch gokonzin zijn, zijn er twee “Socialisme met Chinese kenmerken” en “Volksrepubliek China”. De aanwezigheid van deze zinnen suggereert dat een aanzienlijk deel van de trainingsgegevens feitelijk afkomstig is uit schrijven in de Chinese staatsmedia, waar formele, lange uitdrukkingen uiterst gebruikelijk zijn. OpenAI is … Read more