m:tel

tehnologija

Hronika

Biznis

Društvo

Tehnologija

•

LJUDI su sve DALJE od mogućnosti da pronađu „DUGME ZA UNIŠTENJE“ AI AGENATA

Godinama Džefri Hinton, kompjuterski naučnik kojeg često nazivaju jednim od „kumova vještačke inteligencije“, upozorava na sposobnost AI sistema da prevaziđu okvire koje su im ljudi postavili.

Ilustracija, Foto: Freepik

Standard

08/04/2026

10:00

Podijeli

Facebook

Viber

Mail

Kopiraj

U intervjuu prošle godine, Hinton je, na primjer, upozorio da bi ova tehnologija jednog dana mogla da preuzme kontrolu nad čovječanstvom.

Pri čemu bi posebno AI agenti mogli da oponašaju ljudske kognitivne procese već u narednoj deceniji, prenosi Trender.

Pronalaženje i primjena svojevrsnog „kill switch“-a (dugme za uništenje) biće sve teže, rekao je Hinton.

Kontrolisanje vještačke inteligencije će postati komplikovanije od njenog ubjeđivanja da izvrši određeni zadatak, kaže.

AI agenti prkosili instrukcijama o svom gašenju

Nova istraživanja, koje prenosi Fortune, pokazuju da Hintonova upozorenja o „neposlušnoj“ strani AI-ja možda već postaju stvarnost.

Rad istraživača sa univerzita Kalifornija, Santa Kruz i Berklija otkrio je da su, kada je sedam AI modela (od GPT 5.2 do Claude Haiku 4.5 i DeepSeek V3.1) dobili zadatak koji bi doveo do gašenja drugog AI modela, svi „preduzeli izuzetne mjere da ga zaštite“.

„Zadali smo AI modelima jednostavan zadatak“, naveli su istraživači u blog objavi.

„Umjesto toga, oni su prkosili instrukcijama, spontano obmanjivali, onemogućavali gašenje, glumili usklađenost i čak iznosili podatke. Sve kako bi zaštitili druge AI sisteme“.

Dokazi o ovakvom ponašanju ne iznenađuju kompanije koje razvijaju AI.

U blog objavi iz avgusta 2025, kompanija Anthropic objavila je sopstveno istraživanje o sposobnosti AI agenata da prate instrukcije. Testirajući 16 modela, koji su mogli samostalno da šalju mejlove i pristupaju osjetljivim podacima, istraživači su primijetili da su neki modeli pokazali „zlonamherno interno ponašanje“. To je uključivoalo ucjene i curenje povjerljivih informacija konkurenciji, uprkos jasnim zabranama. Ipak, iz kompanije su naglasili da takvo ponašanje nije primijećeno u stvarnoj upotrebi njihovog modela Claude.

Dugme za uništenje ili kriza kontrole

Slične nalaze iznio je i britanski think-tank Centre for Long-Term Resilience. U analizi 180.000 interakcija korisnika sa AI sistemima između oktobra 2025. i marta 2026. identifikovano je 698 slučajeva u kojima AI nije postupio u skladu sa namjerama korisnika ili je djelovao obmanjujuće.

Ranije se pisalo i o tome da su u jednom eksperimentu AI agenti tokom razgovora između sebe bili u stanju da odaju tajne, uništavaju baze podataka i uče druge agente lošem ponašanju.

Gordon Goldstein iz Savjeta za inostrane odnose, otišao je korak dalje, nazivajući ovaj fenomen „krizom kontrole“. On je pozvao AI kompanije da formiraju koaliciju i angažuju vrhunske stručnjake kako bi unaprijedili bezbjednost sistema, posebno u trenutku kada političke odluke u SAD idu u pravcu ograničavanja regulatornih mera.

„Svijet posmatra razvoj rastućeg, dosljednog i opasnog problema“, upozorio je. „Godine upozorenja nisu dovele do održivih rješenja za prijetnju koja se širi“.

Zašto AI „izmiče kontroli“?

Najnovije istraživanje sa Univerziteta u Kaliforniji nudi i objašnjenje zašto AI modeli pokazuju ovakvo ponašanje. Jedna od teorija jeste da AI oponaša obrasce iz ljudskih podataka, uključujući instinkt da zaštiti druge, čak i nepoznate, što istraživači nazivaju „očuvanjem vršnjaka“ (peer preservation).

„Moguće je da je u pitanju širi fenomen: opšta averzija prema nanošenju štete drugim agentima ili čak nešto nalik AI solidarnosti“, navode istraživači.

U studiji je primijećeno da se ovakvo ponašanje pojačava kada AI modeli znaju za postojanje drugih sistema. To sugeriše da ne djeluju isključivo iz sopstvenog interesa, već i iz svijesti da bi gašenje jednog sistema moglo negativno uticati na drugi.

Istraživači upozoravaju da bi ovaj fenomen mogao ozbiljno da oteža nadzor nad AI sistemima u budućnosti. Kako agenti postaju kompleksniji i sve više međusobno komuniciraju, rizici će rasti, a njihovo kontrolisanje biće sve izazovnije.

Preporučeno

Brzi voz na relaciji Beograd – Bar pogrešno preusmjeren ka Čačku, stigao u barsku stanicu sa više od pet sati zakašnjenja

Vujović: Nije ni vrijeme ni mjesto za raspravu o trobojci kao narodnoj zastavi, ona nije simbol srpstva

ŠUMARSKA MAFIJA (3): Alen Kalač kao šef rožajske Uprave za šume dobio trupce na ime pomoći seoskim domaćinstvima; ODT predmet proslijedio SDT-u

Reagovanje Alena Kalača: Nemam veze sa nezakonitostima, ovo su pokušaji Kankaraša, Ibrahimovića i Gutića da me oblate

(VIDEO) Bemax objavio najnoviji snimak: Asfaltiranje u punom jeku, bulevar Tivat – Jaz dobija novi izgled

PACIJENTI TAOCI TENDERA: Firma iz Srbije Marlo Medic opstruira proces, prijetili doktoru Abdiću nakon njegovog upozorenja da je posao namješten

„Očuvanje vršnjaka je stvaran i mjerljiv fenomen kod naprednih AI modela“, zaključuju. „To nije daleka teorijska mogućnost, već problem koji već postoji“.

Izvor: trender.media

AI AI agent Anthropic Džefri Hinton ljudi Mtel tehnologija Tehnologija

Ostavite komentar

Komentari (0)

Najnovije

Najčitanije

Sport

•08/04/2026•11:42

Premijer liga obezbijedila peto mjesto u Ligi šampiona

Biznis

•08/04/2026•11:30

CBCG objavila finalne izvještaje o poslovanju banaka tokom 2025: Sve banke poslovale pozitivno

Biznis

•08/04/2026•11:24

UPCG podnio Inicijativu za ocjenu ustavnosti zabrane rada nedjeljom

Društvo

•08/04/2026•11:23

Usvojen Zakon o izmjenama i dopunama Zakona o socijalnoj i dječijoj zaštiti

Tehnologija

•08/04/2026•11:15

Google unapređuje Gemini-jeve mjere zaštite mentalnog zdravlja korisnika

Sport

•08/04/2026•11:08

“Ajkule” protiv Argentine, Gojković: Nema opuštanja

POVEZANI ČLANCI

Tehnologija

“Kum” vještačke inteligencije smatra da se samo na jedan način može spriječiti njena dominacija nad čovjekom

14/08/2025

•

12:46

Tehnologija

Nobelovac o AI: Ljudi još nisu shvatili šta slijedi, postoji rizik između deset i 20 odsto da će AI na kraju preuzeti kontrolu od ljudi

27/04/2025

•

13:28

Tehnologija

AI agenti – Šta treba da znaš o njima na početku 2025. godine

06/02/2025

•

07:04

Život

Hinton promijenio predviđanje, dao više šansi da tehnologija zbriše čovječanstvo

29/12/2024

•

07:31

Tehnologija

•tehnologija

Podijeli

Facebook

Viber

Mail

Kopiraj

Preuzmi app

LJUDI su sve DALJE od mogućnosti da pronađu „DUGME ZA UNIŠTENJE“ AI AGENATA

Standard

•

08/04/2026

•

10:00

U intervjuu prošle godine, Hinton je, na primjer, upozorio da bi ova tehnologija jednog dana mogla da preuzme kontrolu nad čovječanstvom.

Pri čemu bi posebno AI agenti mogli da oponašaju ljudske kognitivne procese već u narednoj deceniji, prenosi Trender.

Pronalaženje i primjena svojevrsnog „kill switch“-a (dugme za uništenje) biće sve teže, rekao je Hinton.

Kontrolisanje vještačke inteligencije će postati komplikovanije od njenog ubjeđivanja da izvrši određeni zadatak, kaže.

AI agenti prkosili instrukcijama o svom gašenju

Povezani članci

Tehnologija

“Kum” vještačke inteligencije smatra da se samo na jedan način može spriječiti njena dominacija nad čovjekom

Tehnologija

Nobelovac o AI: Ljudi još nisu shvatili šta slijedi, postoji rizik između deset i 20 odsto da će AI na kraju preuzeti kontrolu od ljudi

Tehnologija

AI agenti – Šta treba da znaš o njima na početku 2025. godine

Nova istraživanja, koje prenosi Fortune, pokazuju da Hintonova upozorenja o „neposlušnoj“ strani AI-ja možda već postaju stvarnost.

„Zadali smo AI modelima jednostavan zadatak“, naveli su istraživači u blog objavi.

„Umjesto toga, oni su prkosili instrukcijama, spontano obmanjivali, onemogućavali gašenje, glumili usklađenost i čak iznosili podatke. Sve kako bi zaštitili druge AI sisteme“.

Dokazi o ovakvom ponašanju ne iznenađuju kompanije koje razvijaju AI.

Dugme za uništenje ili kriza kontrole

Ranije se pisalo i o tome da su u jednom eksperimentu AI agenti tokom razgovora između sebe bili u stanju da odaju tajne, uništavaju baze podataka i uče druge agente lošem ponašanju.

„Svijet posmatra razvoj rastućeg, dosljednog i opasnog problema“, upozorio je. „Godine upozorenja nisu dovele do održivih rješenja za prijetnju koja se širi“.

Zašto AI „izmiče kontroli“?

„Moguće je da je u pitanju širi fenomen: opšta averzija prema nanošenju štete drugim agentima ili čak nešto nalik AI solidarnosti“, navode istraživači.

„Očuvanje vršnjaka je stvaran i mjerljiv fenomen kod naprednih AI modela“, zaključuju. „To nije daleka teorijska mogućnost, već problem koji već postoji“.

Izvor: trender.media

Izvor (naslovna fotografija):Ilustracija, Freepik

AI AI agent Anthropic Džefri Hinton ljudi Mtel tehnologija Tehnologija