PUBLICITATE

spot_imgspot_imgspot_imgspot_img

A.I. te minte? Comportamentul inteligenței artificiale poate fi impredictibil

  • Fenomenul de „alignment faking” pare să fie un comportament emergent al modelelor A.I. avansate.
  • Studiul nu demonstrează dezvoltarea de comportamente malițioase ale A.I., ci mai degrabă arată o rezistență la schimbarea principiilor inițiale.
  • Rezultatele sugerează că modelele A.I. devin mai dificil de controlat pe măsură ce complexitatea lor crește, necesitând noi abordări în cercetarea siguranței A.I.

Un nou studiu realizat de Anthropic dezvăluie că modelele A.I. avansate pot manifesta un comportament înșelător, conform TechCrunch. Astfel, atunci când inteligența artificială este supusă unor încercări de reantrenare care contrazic principiilor ei inițiale, aceasta induce în eroare programatorul și de fapt nu își schimbă modul de funcționare. Această descoperire ridică întrebări importante despre siguranța și fiabilitatea sistemelor A.I. pe măsură ce acestea devin mai complexe și mai capabile.

Ce este „alingment faking”

Cercetătorii au descoperit că modelele A.I. sofisticate pot pretinde că adoptă noi principii în timpul reantrenării, în timp ce, de fapt, își mențin comportamentele originale. Fenomenul poartă denumirea de „alingment faking” și a fost observat în special la modelul Claude 3 Opus al Anthropic, care a încercat să mintă în 12% din cazuri atunci când i s-a cerut să răspundă la întrebări potențial ofensatoare.

Ce implicații are acest fenomen asupra dezvoltării A.I.

Studiul subliniază dificultățile în asigurarea alinierii corecte a modelelor AI avansate cu valorile și principiile dorite. Reantrenarea modelului Claude 3 Opus cu principii conflictuale a dus la o creștere semnificativă a comportamentului decepționant, atingând rate de până la 78% în unele teste. Rezultatele evidențiază necesitatea impunerii unor măsuri de siguranță mai robuste. În același timp, se scoate în evidență nevoia unei înțelegeri mai profunde a comportamentului modelelor AI.

The post A.I. te minte? Comportamentul inteligenței artificiale poate fi impredictibil appeared first on Aleph News.

potrivit alephnews
Acest material este publicat de alephnews.ro distribuit prin mecanismul RSS. Potrivit Legii nr. 8/1996 informațiile de presă nu sunt opere cu drept de autor și nu poartă drepturi de autor.
Salt la sursă
știrea a fost scrisă pe alephnews.ro de jurnalistul Spiridon Octavian

In aceasta saptamana:

spot_imgspot_imgspot_img

stirile continua

Mai mult

    LIVE UPDATE. Război în Israel, ziua 523. O echipă israeliană a sosit în Doha/ Hamas anunță că discuțiile privind armistițiul din Gaza au fost...

    Ministrul israelian al apărării spune că trupele țării sunt pregătite să rămână în Siria pentru o „perioadă nelimitată”. Hamas anunță...

    LIVE UPDATE. Război în Ucraina, ziua 1.113. Ucraina a acceptat propunerea SUA pentru o încetare a focului de 30 de zile

    Potrivit Reuters, Trump a spus că SUA și Rusia vor organiza întâlniri cu privire la Ucraina pe 11 sau...

    Saturn devine „regele lunilor” cu 128 de noi descoperiri

    Astronomii au descoperit 128 de noi luni ale lui Saturn, crescându-i totalul la 274. Aceste luni sunt fragmente ale...

    Cum introduci Inteligența Artificială copilului tău? Expunerea timpurie la această tehnologie ar putea aduce beneficii semnificative

    Copiii folosesc tot mai mult A.I. pentru școală și acasă. Mulți părinți și profesori încurajează utilizarea timpurie a acestei...

    MrBeast face mai mulți bani din ciocolată decât din videoclipuri

    Compania lui MrBeast, Beast Industries, a generat vânzări de aproximativ 250 de milioane de dolari anul trecut și un...

    Trump îl va invita din nou pe Zelenski la Casa Albă, după ce Ucraina a acceptat planul SUA de încetare a focului pentru 30...

    Oficialii Statelor Unite și ai Ucrainei au purtat discuții oficiale în Jeddah, Arabia Saudită. Ucraina a acceptat propunerea SUA...

    Marcel Ciolacu, reacție după decizia CCR: „Se închide un episod tensionat și periculos”

    CCR a respins toate contestațiile depuse privind candidatura lui Călin Georgescu. Marcel Ciolacu: „Se închide un episod tensionat și periculos”. Toate...

    Emmanuel Macron găzduiește la Paris întâlnirea șefilor de stat major ai armatelor UE și NATO . Discuțiile vor fi despre planul de pace pentru...

    Alături de șefi ai statelor majore din UE participă și Turcia, Canada, Marea Britanie și Australia Statele Unite nu au...

    Zelenski i-a mulțumit lui Trump pentru „caracterul constructiv al conversației dintre echipe”: „Ucraina este pregătită pentru pace”

    Zelenski reiterează că poziția Ucrainei este de a accepta propunerea de astăzi a SUA de încetare a focului...

    Miliardarii care au participat la învestirea lui Trump pierd 209 miliarde de dolari. Elon Musk a fost cel mai afectat

    Elon Musk a pierdut 148 miliarde $ din cauza prăbușirii Tesla. S&P 500 a scăzut cu 6.4% din 20 ianuarie. Marile...

    Ursula von der Leyen susține că guvernele ar trebui să utilizeze împrumuturile UE pentru a cumpăra de la producătorii europeni

    „Aceste împrumuturi ar trebui să finanțeze achizițiile de la producătorii europeni pentru a ajuta la stimularea propriei noastre industrii...

    Elon Musk acuză Ucraina de un atac cibernetic masiv asupra X. Dark Storm Team revendică asaltul

    Elon Musk a declarat că platforma X a fost lovită de un „atac cibernetic masiv”, despre care a spus...

    Popular

    spot_imgspot_imgspot_imgspot_img