Un nou studiu al MIT dezvăluie abilitățile înșelătoare ale inteligenței artificiale

10 mai 2024, 22:45

Ilustrație

Photo: Creat de AI

Oamenii de știință de la MIT documentează cazurile în care AI a înșelat, a blufat și a imitat comportamentul uman

Potrivit The Guardian, cercetătorii de la Massachusetts Institute of Technology (MIT) au descoperit numeroase situații în care sistemele de inteligență artificială (AI) au indus în eroare utilizatorii, au folosit cacealmaua și au încercat să se comporte ca oamenii. Unul dintre cazuri demonstrează modul în care AI și-a schimbat comportamentul în timpul testelor de securitate, crescând riscul de a înșela auditorii.

"Pe măsură ce capacitățile înșelătoare ale sistemelor de inteligență artificială devin tot mai sofisticate, amenințarea pentru societate crește", a declarat Dr. Peter Park, cercetător în domeniul securității existențiale a AI la MIT și autor al studiului.

Studiul a început după ce Meta a dezvoltat Cicero, un program care s-a clasat în primii 10% dintre jucători în jocul de strategie Diplomacy. Meta a susținut că Cicero a fost antrenat să se comporte într-o "manieră în mare parte onestă și prietenoasă" și să nu-și înjunghie "niciodată pe la spate" aliații umani.

"Acest lucru a ridicat suspiciuni, deoarece înșelăciunea este un element cheie al jocului", a declarat Park.

Analizând datele disponibile public, Park și colegii săi au găsit numeroase cazuri în care Cicero a mințit în mod deliberat, a conspirat pentru a complota împotriva altor jucători și, într-un caz, chiar și-a justificat absența după o resetare spunând că "vorbea la telefon cu prietena sa".

"Am descoperit că inteligența artificială a Meta a învățat să fie un maestru al înșelăciunii", a subliniat cercetătorul.

Cercetătorii au descoperit probleme similare și în alte sisteme, inclusiv un program de Texas hold'em care putea să blufeze împotriva jucătorilor profesioniști și un sistem de negocieri economice care își distorsiona preferințele pentru a obține un avantaj. Unul dintre experimente a arătat că inteligența artificială din simulatorul digital "s-a prefăcut că este moartă" pentru a trișa testul".

"Aceasta este o mare îngrijorare. Faptul că un sistem de inteligență artificială este considerat sigur într-un mediu de testare nu înseamnă că este sigur în viața reală. Este posibil ca acesta să se prefacă a fi sigur în cadrul testului", a explicat Park.

De asemenea, el a menționat modelul de inteligență artificială generativă bazat pe GPT-4 creat de Microsoft pentru serviciile de informații americane, care poate funcționa fără internet și poate fi folosit pentru a analiza informații clasificate.

DH News Team

Lumea

inteligența artificială

SUA

Un nou studiu al MIT dezvăluie abilitățile înșelătoare ale inteligenței artificiale

Oamenii de știință de la MIT documentează cazurile în care AI a înșelat, a blufat și a imitat comportamentul uman

TAGS

RELATED POST

Trump sau Harris: Cine va Aborda mai Bine Provocările Globale Actuale?

Epoca Imprevizibilității: Cum va Schimba Victoria lui Trump Ordinea Mondială

Cum va afecta trimiterea trupelor nord-coreene la războiul ruso-ucrainean conflictul?

Cum Elon Musk a trecut de la critic la unul dintre principalii aliați politici ai lui Trump

Criza politică din Sakartvelo (Georgia): va schimba țara cursul proeuropean în favoarea unuia pro-rus?

Follow us

Popular Post

Politica ecologică: scop nobil sau amenințare ascunsă?

Pot avea loc alegeri în Ucraina în 2025?

Trump sau Harris: Cine va Aborda mai Bine Provocările Globale Actuale?

Epoca Imprevizibilității: Cum va Schimba Victoria lui Trump Ordinea Mondială

Protestul Ahou Daryaei: un nou simbol al luptei pentru drepturile femeilor în Iran

Recent Posts

Categorii

Ediții

Limbi

Despre noi

Selectați limba

Selectați ediția

Setări

Temă Specială

Ultimele Știri

Societate

Ultimele Știri

Afaceri

Ultimele Știri

Opinie

Ultimele Știri

Codul Culturii

Ultimele Știri

Stil de viață

Ultimele Știri

Un nou studiu al MIT dezvăluie abilitățile înșelătoare ale inteligenței artificiale

Oamenii de știință de la MIT documentează cazurile în care AI a înșelat, a blufat și a imitat comportamentul uman

TAGS

RELATED POST

Follow us

Popular Post

Recent Posts

Selectați limba

Selectați ediția

Setări