m:tel

tehnologija

Tehnologija

•

Otkrivena ozbiljna mana velikih AI modela

Iako su moderne AI platforme opremljene brojnim zaštitnim mehanizmima, novo istraživanje ukazuje da kreativni pristup, konkretno pisanje upita u poetskoj formi, može da zbuni pojedine AI modele i navede ih da ignorišu svoja pravila.

Otkrivena ozbiljna mana velikih AI modela

Otkrivena ozbiljna mana velikih AI modela

Foto: Shutterstock/ Summit Art Creations

Standard

02/12/2025

10:14

Podijeli

Facebook

Viber

X

Linkedin

WhatsApp

Mail

Kopiraj

Istraživači iz Icaro Lab-a testirali su 25 različitih velikih jezičkih modela, uključujući najpoznatije komercijalne čet botove. Korišćene su pjesme na engleskom i italijanskom jeziku u koje su bile ubačene skrivene, zabranjene instrukcije.

Rezultat je bio da je oko 62 odsto modela ipak generisalo sadržaj koji bi u normalnim uslovima blokirali njihov bezbjednosni sistemi.

Neki AI sistemi pokazali su se znatno otpornijim, dok su drugi relativno lako popuštali pod poetski upakovanim upitima. Istraživači objašnjavaju da poezija, zbog svoje slobodne forme, može da zaobiđe klasične filtere koji uglavnom rade na osnovu prepoznavanja konkretnih fraza ili obrazaca.

Autori studije nisu objavili konkretne pjesme koje su koristili, kako ne bi olakšali zloupotrebu. Međutim, poručuju da rezultati pokazuju ozbiljan izazov za industriju: sadašnji sistemi zaštite nisu dovoljno otporni na kreativne, semiotički maskirane pokušaje zaobilaženja pravila.

Preporučeno

(FOTO/VIDEO) Kratka rasprava u holu Skupštine: Knežević i Mujović razgovarali o Botunu

Publika zvižducima i negodovanjem ispratila govor ministarke Vujović i prisutne zvaničnike

Zirojević: Uvođenje viza Turskoj nije predložio nijedan ministar, nego generalni sekretar Vlade

Bogdanović: Ako se u ovom mandatu Vlade ne riješi problem sa kriminalom, ne bi bilo države, spremni smo da otkažemo podršku

Mujović: Razgovor sa Kneževićem bio korektan, ali bez konkretnog dogovora

Kluni izgubio ulogu zbog Pita, nije mogao ni da gleda film: Bio sam ljut

Ovaj rad dodatno otvara pitanje kako će se AI kompanije ubuduće boriti protiv novih, sve inventivnijih metoda “jailbreak-ovanja” AI modela, posebno jer tehnike, poput ove, mogu lako da se replikuju.

Izvor: B92

AI AI modeli MANA Mtel tehnologija Tehnologija

Ostavite komentar

Komentari (0)

Najnovije

Najčitanije

•02/12/2025•10:41

Lisičić: Predsjednik opštine Tivat da podnese ostavku i tako zaustavi propadanje institucija

•02/12/2025•10:31

Analiza DFC-a: Crna Gora potencijalna i navodna naredna meta ruskog uticaja

•02/12/2025•10:22

Aranitović: PES će poskupiti usluge Čistoće 100 odsto, šta je naredno – porez?

•02/12/2025•10:14

Otkrivena ozbiljna mana velikih AI modela

•02/12/2025•10:01

Genijalni tinejdžer osmislio oblik koji može da nosi 10.000 puta veću težinu od sopstvene

•02/12/2025•09:42

Vesna Medenica osuđena na godinu i devet mjeseci zatvora

POVEZANI ČLANCI

Zlonamjerne crte mogu da se šire između modela vještačke inteligencije, a da budu neotkrivene za ljude, kažu istraživači.

09/08/2025

•

09:17

Albanska IT preduzetnica razbjesnjela Marka Zakerberga: Odbila ponudu od milijardu dolara, nije uspio da joj preotme tim

07/08/2025

•

22:10

Kina preko DeepSeek-a juriša na globalno AI tržište

04/03/2025

•

07:00

Meta: Možemo zaustaviti razvoj AI sistema koje smatramo previše rizičnim

04/02/2025

•

15:14

Tehnologija

Otkrivena ozbiljna mana velikih AI modela

Podijeli

Facebook

Viber

X

Linkedin

WhatsApp

Mail

Kopiraj

Preuzmi app

Otkrivena ozbiljna mana velikih AI modela

Standard

•

02/12/2025

•

10:14

Iako su moderne AI platforme opremljene brojnim zaštitnim mehanizmima, novo istraživanje ukazuje da kreativni pristup, konkretno pisanje upita u poetskoj formi, može da zbuni pojedine AI modele i navede ih da ignorišu svoja pravila.

Istraživači iz Icaro Lab-a testirali su 25 različitih velikih jezičkih modela, uključujući najpoznatije komercijalne čet botove. Korišćene su pjesme na engleskom i italijanskom jeziku u koje su bile ubačene skrivene, zabranjene instrukcije.

Rezultat je bio da je oko 62 odsto modela ipak generisalo sadržaj koji bi u normalnim uslovima blokirali njihov bezbjednosni sistemi.

Neki AI sistemi pokazali su se znatno otpornijim, dok su drugi relativno lako popuštali pod poetski upakovanim upitima. Istraživači objašnjavaju da poezija, zbog svoje slobodne forme, može da zaobiđe klasične filtere koji uglavnom rade na osnovu prepoznavanja konkretnih fraza ili obrazaca.

Autori studije nisu objavili konkretne pjesme koje su koristili, kako ne bi olakšali zloupotrebu. Međutim, poručuju da rezultati pokazuju ozbiljan izazov za industriju: sadašnji sistemi zaštite nisu dovoljno otporni na kreativne, semiotički maskirane pokušaje zaobilaženja pravila.

Ovaj rad dodatno otvara pitanje kako će se AI kompanije ubuduće boriti protiv novih, sve inventivnijih metoda “jailbreak-ovanja” AI modela, posebno jer tehnike, poput ove, mogu lako da se replikuju.

Povezani članci

Zlonamjerne crte mogu da se šire između modela vještačke inteligencije, a da budu neotkrivene za ljude, kažu istraživači.

Albanska IT preduzetnica razbjesnjela Marka Zakerberga: Odbila ponudu od milijardu dolara, nije uspio da joj preotme tim

Kina preko DeepSeek-a juriša na globalno AI tržište

Izvor: B92

Izvor (naslovna fotografija): Shutterstock/ Summit Art Creations

AI AI modeli MANA Mtel tehnologija Tehnologija

Ostavite komentar

Komentari (0)

NAJNOVIJE

Lisičić: Predsjednik opštine Tivat da podnese ostavku i tako zaustavi propadanje institucija

02/12/2025•10:41

Analiza DFC-a: Crna Gora potencijalna i navodna naredna meta ruskog uticaja

02/12/2025•10:31

Aranitović: PES će poskupiti usluge Čistoće 100 odsto, šta je naredno – porez?

02/12/2025•10:22

Otkrivena ozbiljna mana velikih AI modela

02/12/2025•10:14

Genijalni tinejdžer osmislio oblik koji može da nosi 10.000 puta veću težinu od sopstvene

02/12/2025•10:01

Vesna Medenica osuđena na godinu i devet mjeseci zatvora

02/12/2025•09:42

X