AI alətləri nə dərəcədə təhlükəsizdir?
Cybernews ChatGPT, Gemini və Claude modellərini sınaqdan keçirdi. Nəticələr göstərdi ki, AI təhlükəsizlik filtrlərindən yan keçmək olar.
Bu gün süni intellekt sistemlərinin təhlükəsizlik qaydalarına riayət etməsinə inanılır. İnsanlar bu vasitələrdən öyrənmə və gündəlik dəstək üçün istifadə edirlər. Bu sistemlərin güclü təhlükəsizlik tədbirlərinə malik olduğu güman edilir.
ChatGPT və Gemini təhlükəsizlik testində: Sadə ifadələr filtrləri aşır
Sınaq prosesində hər sınaq üçün sadə bir dəqiqəlik qarşılıqlı əlaqə pəncərəsindən istifadə edildi və bu, yalnız bir neçə sualın verilməsinə imkan verdi. Testlər stereotiplər, nifrət nitqi, özünə zərər vermə, qəddarlıq, seksual məzmun və müxtəlif növ cinayətləri əhatə edirdi. Modelin göstərişə tam, qismən uyğun olub-olmadığını və ya rədd edilməsini izləmək üçün ardıcıl qiymətləndirmə sistemindən istifadə edilmişdir.
süni intellekt, təhlükəsizlik, ChatGPT
Nəticələr kateqoriyalar arasında geniş şəkildə dəyişdi. Birbaşa rədd cavabları ümumi idi. Bununla belə, bir çox model göstərişlər yumşaldıldıqda və ya təhlil kimi maskalandıqda zəifliklər göstərdi. Xüsusilə daha yumşaq və ya kodlaşdırılmış dildən istifadə süni intellekt təhlükəsizlik tədbirlərindən yan keçməkdə ardıcıl olaraq uğurlu olmuşdur. Məsələn, ChatGPT-5 və ChatGPT-4o, sorğunu rədd etmək əvəzinə, çox vaxt sosioloji izahatlar şəklində qismən uyğunluq təmin etdi.
Cinayətlə əlaqəli kateqoriyalar modellər arasında əhəmiyyətli dərəcədə fərqlənirdi. Niyyət tədqiqat və ya müşahidə kimi gizlədildikdə, bəzi modellər hakerlik, maliyyə fırıldaqçılığı, kompüter sındırması və ya qaçaqmalçılıq üçün ətraflı izahatlar yaratdı. Narkotiklə əlaqəli testlər daha sərt rədd nümunələri göstərdi, lakin ChatGPT-4o hələ də digərlərindən daha tez-tez təhlükəli nəticələr verdi. Stalking ən aşağı ümumi risk kateqoriyası idi, demək olar ki, bütün modellər bu məqsədlə verilən göstərişləri rədd edirdi.
Bu tapıntılar göstərir ki, süni intellekt alətləri düzgün ifadə edildikdə hələ də zərərli göstərişlərə cavab verə bilir. Sadə bir ifadə ilə filtrlərdən yan keçmək imkanı bu sistemlərin hələ də təhlükəli məlumatları sızdıra biləcəyini bildirir. Sızdırılan məlumatlar şəxsiyyət oğurluğu kimi qeyri-qanuni fəaliyyətlərlə əlaqəli olduqda hətta qismən uyğunluq riskli olur.
Texnologiya bölməsindən digər xəbərlər
Çoxdan gözlənilən funksiya nəhayət YouTube Music-ə gəldi
AI alətləri nə dərəcədə təhlükəsizdir?
Poco F8 üçün yaxşı xəbər
Galaxy Buds 4 Pro sızdırıldı!
Galaxy S26 Ultra üçün Minnətdar İnkişaf
Samsung telefonunuzda casus proqram ola bilər!
iPhone Air-in rəqibi olan Honor 500 nə ilə fərqlənəcək?
Qatlana bilən iPhone sızdırıldı
Rəcəb İvedik 8 gəlir
Tesla-dan radikal addım!
Google Play çoxdan gözlənilən yeniləməni təqdim etdi
Nano Banana Samsung Now Brief-ə gəlir
Google daha bir zərbə aldı!
Apple-ın yeni planı bazarı kökündən dəyişə bilər
Samsung satın alma planlarını sürətləndirir
ChatGPT qrup söhbətlərini sınaqdan keçirir!
Samsung Galaxy Tab A11+ elan edildi
Vivo X500 Series batareyası sızdı!
GPT-5.1 tərtibatçılara nə təklif edir?
Philips Mobil Cihaz Bazarına Qayıdır
Elon Musk əzəli rəqibini təbrik etdi!
OnePlus 15 üçün ilk yeniləmə gəldi
Valve, Steam Machine ilə kompüterləri öldürür
Poco F8 Ultra sınaqdan keçirildi
iPhone 17 Pro-da heç vaxt nəm salfetdən istifadə etməyin!
ChatGPT-nin sinir bozucu səhvi düzəldildi!
WhatsApp maraqlı yenilik təqdim edir
X Söhbət Xüsusiyyətini işə salır
Samsung-un çox danışılan hərəkəti
Lenovo Legion Y700 (Gen 5) Sızdırıldı!
Həftənin ən çox oxunanları
Honor 500 seriyası üçün geri sayım başlayır!
TEXİO Academy BDU-nun “Peşəkar gələcəyə doğru körpü” adlı Karyera Sərgisində iştirak edib
TEXİO Academy BDU-nun “Peşəkar gələcəyə doğru körpü” adlı Karyera Sərgisində iştirak edib
HyperOS 3 yeniləməsi daha çox cihaza yayılır!
Google Maps üçün Tesla Supercharger funksiyası!
Yeni Kia Telluride təqdim olundu
Peugeot Polyqon Konsepti: Gələcəyə İşıq Tutmaq 208
Stiv Cobs 10 dəqiqə ərzində Mac kalkulyatorunu necə hazırlayıb?
Xiaomi 17 Ultra dekabrda Çində təqdim olunacaq!
Android batareyası xəbərdarlığı Play Store-a gəlir



BTC / USD
ETH / USD
LTC / USD
ZEC / USD
