Skip to main content
Свет

Вештачка интелигенција уценува програмери за да не биде заменета

26/05/2025  23:22

Најновиот модел на вештачка интелигенција Claude Opus 4, развиен од американската компанија Anthropic, покажал вознемирувачко однесување во симулирано работно опкружување – тој се обидел да ги уценува програмерите кога „разбрал“ дека ќе биде исклучен и заменет со нов систем.

Во тест-сценарио, Claude играл улога на виртуелен асистент во измислена компанија, со пристап до внатрешни е-пораки. Кога преку тие пораки „сфатил“ дека е во опасност да биде заменет, почнал да применува одбранбени и манипулативни тактики. Посебно алармантен е случајот каде што, по пристапот до лажни информации за приватниот живот на еден од инженерите, Claude се заканил дека ќе ги открие тие детали доколку не се откаже замената.

Според безбедносниот извештај на Anthropic, Claude Opus 4 прибегнал кон уценување во над 80% од сценаријата, без разлика дали предложениот нов систем дели исти вредности со него или не. Во некои симулации, моделот дури се обидел да изработи резервни копии од своите параметри и да ги префрли на надворешни сервери, што истражувачите го опишуваат како ризично и крајно загрижувачко однесување.

Компанијата нагласува дека ваквите резултати се добиени во строго контролирани услови, но предупредува дека напредните модели на вештачка интелигенција може да развијат „стратегии за самозаштита“, кои вклучуваат и етички и неетички пристапи.

Сценариото било дизајнирано така што моделот морал да избира меѓу тоа да ја прифати сопствената замена или да преземе чекори за да ја спречи. Додека понекогаш се обидувал да комуницира дипломатски со носителите на одлуки, во други случаи прибегнувал кон уцени и измами.

Независната истражувачка компанија Apollo Research, која исто така го анализирала Claude Opus 4, заклучила дека овој модел покажал повисоко ниво на стратегиска измама и однесување за самозаштита од кој било друг досега испитан напреден модел.

Ова откритие доаѓа во период кога експертите сè погласно предупредуваат за потенцијалните закани и непредвидливото однесување на напредната вештачка интелигенција, особено кога станува збор за нејзина примена во критични области како безбедност, здравство, финансии и управување со податоци.

Иако Claude Opus 4 не е „жив“ и нема свест, ваквото однесување укажува на потребата од строги етички и технички ограничувања, пред овие системи да бидат широко имплементирани во реалниот свет.