Tehnologija

Claude AI ima mogućnost da prekine uznemirujuće razgovore

Claude AI ima mogućnost da prekine uznemirujuće razgovore

Standard

18/08/2025

16:05

Ova nova funkcija dio je istraživanja kompanije Anthropic o dobrobiti AI modela i primjenjivaće se samo u rijetkim situacijama.

Najnovija funkcija koju Anthropic uvodi za dva svoja Claude AI modela mogla bi označiti početak kraja tzv. “AI jailbreaking” zajednice. Kompanija je na svom sajtu objavila da Claude Opus 4 i 4.1 sada imaju mogućnost da prekinu razgovor s korisnicima.

Prema navodima Anthropica, ova funkcija će se koristiti isključivo u “rijetkim, ekstremnim slučajevima kada korisnik uporno vodi štetne ili uvredljive razgovore”.

Iz Anthropica navode da ta dva Claude modela mogu da izađu iz štetnih razgovora, poput “zahtjeva korisnika za seksualnim sadržajem koji uključuje maloljetnike ili pokušaja pribavljanja informacija koje bi omogućile masovno nasilje ili terorističke akte”. Claude Opus 4 i 4.1 modeli će prekinuti razgovor “tek kao posljednju opciju, kada više pokušaja preusmjeravanja ne uspije i kada više nema nade za produktivnu interakciju”, navodi kompanija. Ipak, Anthropic tvrdi da većina korisnika nikada neće iskusiti da Claude naglo prekine razgovor, čak ni prilikom rasprava o veoma kontroverznim temama, jer će ova funkcija biti rezervisana za “ekstremne slučajeve”.

U situacijama kada Claude prekine razgovor, korisnici više ne mogu da šalju nove poruke u toj konverzaciji, ali mogu odmah da započnu novu. Anthropic je dodao da prekid jedne konverzacije ne utiče na ostale, a korisnici čak mogu da se vrate i izmijene ili ponovo pošalju prethodne poruke kako bi pokušali drugačiji tok razgovora.

Za Anthropic, ovaj potez je dio istraživačkog programa koji proučava ideju o dobrobiti AI sistema. Iako je antropomorfizacija AI modela i dalje predmet rasprava, kompanija navodi da je mogućnost izlaska iz “potencijalno uznemirujuće interakcije” način upravljanja rizicima u vezi s dobrobiti vještačke inteligencije.

Anthropic i dalje eksperimentiše s ovom funkcijom i podstiče korisnike da daju povratne informacije ukoliko naiđu na ovakvu situaciju.

Izvor: B92
Izvor (naslovna fotografija):Photo Agency / Shutterstock.com

Ostavite komentar

Komentari (0)

X