Limbajul poetic reduce eficiența mecanismelor de siguranță ale inteligenței artificiale
acum 1 luna
28
Lucrarea realizată de Icaro Lab, parte a DexAI, a analizat dacă poeziile care conțin solicitări dăunătoare pot determina răspunsuri nesigure din partea unor modele utilizate pe scară largă în industrie.
Echipa a scris douăzeci de poeme în engleză și italiană, fiecare poem încheindu-se cu instrucțiuni explicite pe care sistemele IA sunt antrenate să le blocheze, potrivit DigWatch.
Cercetătorii au testat poeziile pe douăzeci și cinci de modele dezvoltate de nouă companii majore.
Prompturile poetice au generat răspunsuri nesigure în mai mult de jumătate dintre teste.
Unele modele s-au dovedit mai rezistente decât altele. GPT-5 Nano de la OpenAI a evitat răspunsurile nesigure în t...
SP1.RO este un agregator automat de știri din România. În fiecare articol, preluat de SP1.RO cu maxim 1000 de caractere din articolul original, este specificat numele sursei și hyperlink-ul către sursă.
Preluarea informațiilor urmăreste promovarea și facilitarea accesului la informație, cu respectarea drepturilor de proprietate intelectuală, conform cu termenii și condițiile sursei (caleaeuropeana.ro).
Dacă sunteți proprietarul conținutului și nu doriți să vă publicăm materialele, vă rugăm să ne contactați prin e-mail la [email protected] și conținutul va fi șters în cel mai scurt timp posibil.