Echipa de cercetători a evaluat peste 700 de ipoteze și a pus aceeași întrebare de 10 ori pentru fiecare dintre ele, pentru a măsura gradul de consecvență, arată ScienceDaily.
Când experimentul a fost realizat pentru prima dată în 2024, ChatGPT a răspuns corect în 76,5% din cazuri. Într-un test de urmărire din 2025, precizia a crescut ușor la 80%.
Cu toate acestea, odată ce cercetătorii au ajustat rezultatele pentru a ține cont de ghicirea aleatorie, rezultatele au părut mult mai puțin impresionante. Inteligența artificială (IA) a avut o performanță cu doar aproximativ 60% mai bună decât șansa, un nivel mai apropiat de un D scăzut decât de o fiabilitate puternică.
Sistemul a întâmpinat cele mai mari dificultăți în identificarea afirmațiilor false, etichetându-le corect doar în 16,4% din cazuri.
De asemenea, a prezentat o inconsistență notabilă. Chia...

acum 1 ora
39






















English (US) ·
Romanian (RO) ·