ChatGPT-5 viser færre hallusinasjoner, men gjør fortsatt feil

OpenAIs GPT-5 har blitt introdusert som selskapets mest avanserte AI-modell til nå, med store forbedringer i nøyaktighet og resonnement. En av de viktigste endringene som fremheves av selskapet er en betydelig reduksjon i hallusinasjoner, begrepet som brukes når AI produserer informasjon som er falsk eller villedende. Denne forbedringen er ment å gjøre modellen mer pålitelig for komplekse oppgaver, enten det er å svare på spørsmål, hjelpe til med forskning eller generere kreativt innhold.

Modellens nye "tenke"-modus, kombinert med bedre treningsdata og raffinerte sikkerhetsmekanismer, er designet for å gi svar som er både mer nøyaktige og mer transparente om usikkerhet. GPT-5 er også mer sannsynlig å innrømme når den ikke vet noe i stedet for å gi et sikkert, men feil svar. Disse oppdateringene representerer OpenAIs pågående innsats for å adressere en av de største kritikkene av tidligere AI-modeller – at de ofte produserer overbevisende, men faktisk feilaktig informasjon.

I følgesystemkortfor GPT-5 er reduksjonen i hallusinasjon målbar og varierer mellom moduser:

GPT-5-tenkning med surfing: 4,5 % hallusinasjonsfrekvens
GPT-5-main: 9,6 % hallusinasjonsrate
o3: 12,7 % hallusinasjonsrate
GPT-4o: 12,9 % hallusinasjonsrate

Til tross for disse fremskrittene er ikke GPT-5 feilfri. Tester har vist at mens hallusinasjonsratene har falt sammenlignet med GPT-4o, kan modellen fortsatt gjøre grunnleggende feil. Eksempler inkluderer feil i stavemåten, feilidentifisering av geografiske steder og oppretting av detaljer som ikke eksisterer. Disse feilene understreker at selv om nøyaktigheten har forbedret seg, er modellens evne til å garantere faktariktighet fortsatt begrenset. Dette betyr at brukere bør fortsette å verifisere AI-generert innhold før de stoler på det for viktige avgjørelser.

Les mer:Apple viser Find My gjør det vanskelig å sveipe MacBook for «lette penger» i en ny annonse

Lanseringen av GPT-5 utløste også debatt om hvordan AI presenteres for publikum. Visuelt materiale og reklamemateriell som ble brukt under kunngjøringen ble senere kritisert for å ha feilaktig representert visse statistikker, noe som førte til avklaringer. Dette reiste spørsmål om åpenhet, ikke bare i AIs svar, men også i hvordan dens evner kommuniseres.

Forbedringene i GPT-5 markerer et skritt fremover for AI-pålitelighet, men de tjener også som en påminnelse om at ingen AI-modell er perfekt. Selv med reduserte hallusinasjonsfrekvenser avhenger teknologien fortsatt av mønstre i data i stedet for en sann forståelse av fakta. For applikasjoner innen utdanning, journalistikk, helsevesen og andre høyinnsatsfelt er menneskelig tilsyn fortsatt viktig.

Totalt sett beveger GPT-5 seg nærmere målet om en mer pålitelig AI-assistent, men forsiktighet er fortsatt nødvendig. Modellens styrker i resonnement, kreativitet og samtaleevne er tydelige, men det er også svakhetene når det gjelder saklig presisjon. Ettersom AI-teknologien fortsetter å utvikle seg, vil balansen mellom flyt og nøyaktighet forbli i hjertet av samtalen.