ChatGPT toont meer redeneervermogen, maar ook toename in feitelijke onjuistheden

AI-chatbots zoals ChatGPT worden met elke nieuwe versie intelligenter, maar ook minder betrouwbaar. Waar eerdere modellen vooral vloeiend tekst konden genereren, zijn OpenAI’s nieuwste versies, GPT o3 en o4-mini, ontworpen om logisch te redeneren zoals mensen dat doen. Toch blijkt uit een recent intern onderzoek van OpenAI, gedeeld met The New York Times, dat deze vooruitgang een prijs heeft: een sterke toename in zogenoemde ‘hallucinaties’, oftewel verzinsels die als feiten worden gepresenteerd.

Onjuistheden

Bij een test rond publieke figuren bleek dat GPT o3 in een derde van de gevallen onjuiste informatie gaf. Dat is tweemaal zoveel als het oudere o1-model. Het kleinere o4-mini-model deed het nog slechter, met hallucinaties in 48 procent van de antwoorden. En bij algemene kennisvragen uit de SimpleQA-benchmark gingen de cijfers nog verder omhoog: 51 procent van de antwoorden van GPT o3 en maar liefst 79 procent van o4-mini bevatte verzonnen gegevens.

Deze ontwikkeling is zorgwekkend, vooral omdat deze nieuwe modellen juist zijn gepresenteerd als redeneermachines. Maar volgens AI-onderzoekers is dat misschien ook precies het probleem. Hoe meer een model probeert te redeneren, hoe meer stappen het moet zetten en elke stap is een kans om verkeerd af te slaan. In plaats van veilige, bekende antwoorden te geven, wagen de modellen zich aan speculaties en pogingen om verbanden te leggen tussen losse feiten. Dat klinkt creatief, maar het leidt ook vaker tot onjuistheden.

Redeneermodellen

OpenAI benadrukt dat de toename in hallucinaties niet per se betekent dat redeneermodellen slechter zijn. Het zou ook kunnen dat deze modellen simpelweg uitgebreider en avontuurlijker antwoorden formuleren. Daardoor vervaagt de grens tussen theorie en realiteit, met soms kwalijke gevolgen. Zo zijn er al advocaten in de problemen gekomen doordat ze ChatGPT gebruikten en niet doorhadden dat bepaalde rechtszaken volledig uit de duim gezogen waren.

Wat als hulpmiddel bedoeld is, kan zo snel een risico worden. Meer intelligentie mag nooit ten koste gaan van betrouwbaarheid, anders blijft de chatbot vooral een briljante fantast.

Lees meer over Gadgets

Samsung Galaxy VR officieel: alles op een rij

De Samsung Galaxy XR is officieel onthuld, precies zoals het bedrijf eerder al aangaf. Het is Samsung's antwo...

Colin Baak 1 uur geleden

Topartikel

Laptop opladen met een powerbank: hier moet je op letten

Als je veel reist voor werk, wil je niet altijd veel meenemen. In plaats van zo'n groot stekkerblok om je lap...

Colin Baak 6 oktober 2025

Topartikel

Dit zijn de 4 beste zakelijke foldables

Verschillende fabrikanten brengen al jaren foldables uit, oftewel smartphones die je kunt vouwen. Je hebt ze ...

Colin Baak 8 oktober 2025

OpenAI bevestigt: GPT-6 verschijnt niet in 2025

OpenAI heeft officieel bevestigd dat GPT-6 dit jaar niet wordt uitgebracht. Dat betekent echter niet dat het ...

Laurens van Aggelen 2 dagen geleden

Experts aan het woord

Blijf op de hoogte, abonneer!

ChatGPT toont meer redeneervermogen, maar ook toename in feitelijke onjuistheden

Onjuistheden

Redeneermodellen

Weerbaarheid gaat verder dan een cyberaanval afweren

Google beëindigt Privacy Sandbox na jaren tegenslag

Autobranche uit ‘grote zorgen’ over mogelijk chiptekort Nexperia

Axis Communications maakt van bewakingscamera’s muziekinstrumenten

Infor's industry-specific ERP strategy and Velocity Suite deep dive

Nutanix CTO explains their VMware alternative and multi-cloud strategy

How VMware VCF 9 and Tanzu simplify enterprise automation

Workday CTO outlines bold AI agent strategy and major acquisitions

De rol van het netwerk in de weerbaarheid van Belgische bedrijven

Slimmer printen met Managed Print Services

Tarieven zetten bedrijven onder druk: hoe kan je er slim mee omgaan?

Van hiërarchie naar ecosysteem: hoe mens en AI samen bouwen aan een duurzame toekomst

Synology Solution Day 2025

Dell Technologies Forum

BrickCon The Databricks Community Conference

Appdevcon

Webdevcon

Dutch PHP Conference

Ontgrendel het volledige potentieel van je SAP-omgeving

Een cloudstrategie is essentieel voor het succes van uw bedrijf