PUBLICITATE

spot_imgspot_imgspot_imgspot_img

A.I. te minte? Comportamentul inteligenței artificiale poate fi impredictibil

  • Fenomenul de „alignment faking” pare să fie un comportament emergent al modelelor A.I. avansate.
  • Studiul nu demonstrează dezvoltarea de comportamente malițioase ale A.I., ci mai degrabă arată o rezistență la schimbarea principiilor inițiale.
  • Rezultatele sugerează că modelele A.I. devin mai dificil de controlat pe măsură ce complexitatea lor crește, necesitând noi abordări în cercetarea siguranței A.I.

Un nou studiu realizat de Anthropic dezvăluie că modelele A.I. avansate pot manifesta un comportament înșelător, conform TechCrunch. Astfel, atunci când inteligența artificială este supusă unor încercări de reantrenare care contrazic principiilor ei inițiale, aceasta induce în eroare programatorul și de fapt nu își schimbă modul de funcționare. Această descoperire ridică întrebări importante despre siguranța și fiabilitatea sistemelor A.I. pe măsură ce acestea devin mai complexe și mai capabile.

Ce este „alingment faking”

Cercetătorii au descoperit că modelele A.I. sofisticate pot pretinde că adoptă noi principii în timpul reantrenării, în timp ce, de fapt, își mențin comportamentele originale. Fenomenul poartă denumirea de „alingment faking” și a fost observat în special la modelul Claude 3 Opus al Anthropic, care a încercat să mintă în 12% din cazuri atunci când i s-a cerut să răspundă la întrebări potențial ofensatoare.

Ce implicații are acest fenomen asupra dezvoltării A.I.

Studiul subliniază dificultățile în asigurarea alinierii corecte a modelelor AI avansate cu valorile și principiile dorite. Reantrenarea modelului Claude 3 Opus cu principii conflictuale a dus la o creștere semnificativă a comportamentului decepționant, atingând rate de până la 78% în unele teste. Rezultatele evidențiază necesitatea impunerii unor măsuri de siguranță mai robuste. În același timp, se scoate în evidență nevoia unei înțelegeri mai profunde a comportamentului modelelor AI.

The post A.I. te minte? Comportamentul inteligenței artificiale poate fi impredictibil appeared first on Aleph News.

potrivit alephnews
Acest material este publicat de alephnews.ro distribuit prin mecanismul RSS. Potrivit Legii nr. 8/1996 informațiile de presă nu sunt opere cu drept de autor și nu poartă drepturi de autor.
Salt la sursă
știrea a fost scrisă pe alephnews.ro de jurnalistul Spiridon Octavian

In aceasta saptamana:

spot_imgspot_imgspot_img

stirile continua

Mai mult

    Soarta TikTok în SUA se va decide pe 10 ianuarie. Curtea Supremă va hotărî dacă interzicerea aplicației încalcă dreptul la liberă exprimare

    Trump s-a întâlnit cu șeful companiei și vorbește acum despre o posibilă abordare mai blândă. TikTok ar putea funcționa...

    Zelenski recunoaște că Ucraina nu își poate recupera teritoriile. Care sunt variantele pentru încheierea războiului

    Liderul ucrainean spune că Occidentul va trebui să așeze Rusia la masa negocierilor. Zelenski s-a întâlnit la Bruxelles cu Mark...

    Marcel Ciolacu anunță că PSD se retrage din coaliție și va vota un guvern de dreapta: „Nu fugim de responsabilitate”

    Ciolacu a invocat faptul că „a înțeles perfect votul românilor”. El spune că „nu poți construi nimic durabil cu parteneri...

    Netanyahu se întâlnește cu oficiali de rang înalt pentru discuții despre acordul de încetare a focului cu Hamas

    Premierul Netanyahu discută joi cu membri ai cabinetului despre un acord de încetare a focului. Acordul de încetare a focului...

    Cel puțin 100 de soldați nord-coreeni au fost uciși în luptele din războiul din Ucraina. Alți 1.000 au fost răniți

    Lee Sung-kwon a declarat că alți 1.000 au fost răniți. El a declarat că printre victime se numără și oficiali...

    Zelenski admite că Ucraina nu poate îndepărta trupele ruse din zonele ocupate: „Nu putem renunța la teritoriile noastre”

    El a declarat că diplomația este singura opțiune pentru a-l determina pe președintele Vladimir Putin să își retragă armata. „Nu...

    Apple renunţă la ideea de a comercializa iPhone-uri pe bază de abonament

    La începutul acestui an, Apple a implementat serviciul de abonament pentru iPhone ca test pentru angajații din cadrul...

    Cara Delevingne interpretează rolul lui Elton John într-un nou videoclip pentru piesa sa „Step Into Christmas”

    Modelul a declarat că interpretarea artistului a fost „un vis pe care nu știam că îl am până nu...

    Medvedev amenință editorii de la ziarul Times: „Sunt ținte militare legitime”

    Dmitri Medvedev, vicepreședintele Consiliului de Securitate al Rusiei, a declarat pe Telegram că editorii de la ziarul Times reprezintă...

    LIVE UPDATE. Război în Ucraina, ziua 1.030. Un oficial confirmă că Ucraina va începe activitatea pe clusterele de aderare la UE în prima jumătate...

    Două clustere pentru aderarea Ucrainei la UE vor fi lansate în prima jumătate a anului 2025, sub președinția Poloniei...

    LIVE UPDATE. Război în Israel, ziua 440. Forțele israeliene au demolat mai multe case, în sudul Libanului

    Israelul a demolat case în mai multe localități din sudul Libanului, inclusiv Tyre și Naqoura, încălcând acordul de încetare...

    Liderul de facto din Siria a afirmat că țara este epuizată și nu reprezintă o amenințare pentru vecini sau pentru Occident. Ahmed al-Sharaa vrea...

    În interviul său, al-Sharaa a subliniat importanța educației pentru femei și a afirmat că Siria nu va deveni o...

    Popular

    spot_imgspot_imgspot_imgspot_img