Вештачка интелигенција уценува програмери за да не биде заменета

Најновиот модел на вештачка интелигенција Claude Opus 4, развиен од американската компанија Anthropic, покажал вознемирувачко однесување во симулирано работно опкружување – тој се обидел да ги уценува програмерите кога „разбрал“ дека ќе биде исклучен и заменет со нов систем.

Во тест-сценарио, Claude играл улога на виртуелен асистент во измислена компанија, со пристап до внатрешни е-пораки. Кога преку тие пораки „сфатил“ дека е во опасност да биде заменет, почнал да применува одбранбени и манипулативни тактики. Посебно алармантен е случајот каде што, по пристапот до лажни информации за приватниот живот на еден од инженерите, Claude се заканил дека ќе ги открие тие детали доколку не се откаже замената.

Според безбедносниот извештај на Anthropic, Claude Opus 4 прибегнал кон уценување во над 80% од сценаријата, без разлика дали предложениот нов систем дели исти вредности со него или не. Во некои симулации, моделот дури се обидел да изработи резервни копии од своите параметри и да ги префрли на надворешни сервери, што истражувачите го опишуваат како ризично и крајно загрижувачко однесување.

Компанијата нагласува дека ваквите резултати се добиени во строго контролирани услови, но предупредува дека напредните модели на вештачка интелигенција може да развијат „стратегии за самозаштита“, кои вклучуваат и етички и неетички пристапи.

Сценариото било дизајнирано така што моделот морал да избира меѓу тоа да ја прифати сопствената замена или да преземе чекори за да ја спречи. Додека понекогаш се обидувал да комуницира дипломатски со носителите на одлуки, во други случаи прибегнувал кон уцени и измами.

Независната истражувачка компанија Apollo Research, која исто така го анализирала Claude Opus 4, заклучила дека овој модел покажал повисоко ниво на стратегиска измама и однесување за самозаштита од кој било друг досега испитан напреден модел.

Ова откритие доаѓа во период кога експертите сè погласно предупредуваат за потенцијалните закани и непредвидливото однесување на напредната вештачка интелигенција, особено кога станува збор за нејзина примена во критични области како безбедност, здравство, финансии и управување со податоци.

Иако Claude Opus 4 не е „жив“ и нема свест, ваквото однесување укажува на потребата од строги етички и технички ограничувања, пред овие системи да бидат широко имплементирани во реалниот свет.

Вештачка интелигенција уценува програмери за да не биде заменета

Вечерва вооружен напад во Тетово

Испукани 30 куршуми врз семејна куќа во Тетово – напаѓачите се дадоа во бегство со скутер

Најнови вести

Опасна хемиска пена се излеа на булевар во Скопје – Градските служби реагираа

Зијадин Села ја напушта коалицијата со ДУИ

Од кошмарот во Кардиф до четврти шешир: Македонија поразена 7-1 од Велс

Германија со јасен сигнал – Европската перспектива на Македонија е наш приоритет

Калиопи:Ја пеам химна за сите! Не сум ничија партија!

Најчитани вести

Сиљановска-Давкова ги отповика тројцата амбасадори

,,Не брзаше, изгледаше мртов ладен!” – Таксистот ги опиша последните минути од Алдина Јахиќ: Таа извика „има пиштол, има пиштол, никој не трчаше по неа…“

Села постави три клучни услови за влез во Владата

ПОЧНУВА НЕВРЕМЕТО: Македонија на удар на многу обилни дождови и опасност од поплави