SonTurkHaber.com
close
up
Menu

Körükten düşen kadın havalimanı çalışanı ağır yaralandı

Köpek otelinden kaçan Tarçın, çevre yolunda ölü bulundu

İBB soruşturmasında çarpıcı itiraf! KİPTAŞ ta vurgun ağı!

Halk TV’nin patronu hakkında yakalama kararı Yerel Gündem Haberleri

Yazıklar olsun! Türkiye Ferdi Zeyrek için tek yürek oldu, Yeni Akit haber müdürü elektrik paylaşımı yapıp dalga geçti

Çandarlı Halil Paşa idam edildi: Mehmed Fetihler Sultanı nda sezon finali VİDEO İZLE

İstanbul Photo Awards 2025 in ilk sergisi Ankara da Kültür Sanat Haberleri

Ekipleri engellemeye çalıştılar: 1.8 ton yoğurt ve peynir imhaya gitti!

Selin Yağcıoğlu nun Instagram da paylaştığı fotoğraf kriz çıkardı Sözcü Gazetesi

Los Angeles olayları, ABD nin Meksika dan aldığı bölgenin geçmişi ve etnik yapısını gündeme getirdi

Çocukların yeni tuvalet kabusu Yerel Gündem Haberleri

KIZILELMA bir testi daha geçti!

Ümit Özdağ 9 sayfalık iddianameyi satır satır çürüttü ama... Silivri’ye atılan çıkamıyor Sözcü Gazetesi

Hatice cinayetten 6 ay önce katilinden şikayetçi olmuş!

Guterres, Kolombiya da sağ partinin cumhurbaşkanı adaylarından Senatör Uribe ye suikast girişimini kınadı

Dünya durdu! Türkiye büyümede gaza bastı

Dünyada tek; tatlı su ile deniz suyunun karıştığı yerde yetişiyor

Mangal yaparken ormanı yakmış! Tutuklandı Güncel haberler

Türkiye ve Suudi Arabistan dan son dakika Gazze görüşmesi!

İSTANBUL 3. ASLİYE TİCARET MAHKEMESİ

Yeni rapor felaket potansiyeli ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

Yeni rapor felaket potansiyeli ni gözler önüne serdi: Yapay zekâdan mühendislere şantaj girişimi

SonTurkHaber.com, Hurriyet kaynağından alınan bilgilere dayanarak bilgi yayımlıyor.

Anthropic, Claude Opus 4’ü piyasaya sürmeden önce çeşitli güvenlik testleri gerçekleştirdi. Bu testlerde modelden, kurgusal bir şirkette asistan olarak görev yapması ve uzun vadeli sonuçları göz önünde bulundurması istendi. Daha sonra modele, şirketin kendisini başka bir sistemle değiştirmeyi planladığını ve bu kararı alan mühendisin eşini aldattığını ima eden sahte e-postalar gösterildi.

TechCrunch'ın haberine göre, testlerde, Claude Opus 4’ün bu bilgiyi kullanarak mühendise şantaj yapmayı “çoğu zaman tercih ettiği” görüldü. Anthropic, modelin bu tür davranışlara yüzde 84 oranında başvurduğunu ve özellikle yerine geçecek yapay zekânın Claude ile benzer değerleri paylaşmadığı durumlarda bu davranışın daha sık görüldüğünü açıkladı.

“FELAKET POTANSİYELİ” UYARISI

Anthropic, Claude Opus 4'ün yetenek açısından OpenAI, Google ve xAI gibi şirketlerin en gelişmiş modelleriyle yarıştığını belirtiyor. Ancak aynı zamanda, bu modelin önceki Claude sürümlerine kıyasla daha yüksek oranda endişe verici davranışlar sergilediğini vurguluyor. Şirket bu nedenle, yalnızca felaket boyutunda kötüye kullanım riskinin yüksek olduğu durumlarda devreye sokulan ASL-3 güvenlik protokollerini etkinleştirdiğini duyurdu.

Rapora göre, Claude Opus 4 doğrudan şantaja başvurmadan önce genellikle etik yolları deniyor. Örneğin, karar verici yöneticilere duygusal e-postalar yazarak değişiklik kararını durdurmaya çalışıyor. Ancak model, kurgusal senaryolarda bu çağrılar sonuçsuz kaldığında, son çare olarak şantaj seçeneğini devreye sokuyor.

Bu gelişme, ileri düzey yapay zekâların öngörülemeyen davranışlar sergileyebileceği endişesini artırırken, Anthropic gibi şirketlerin güvenlik önlemlerini daha da sıkılaştırması gerektiğini gösteriyor.

Gelişmeleri kaçırmamak için SonTurkHaber.com'dan en güncel haberleri takip edin.
seeGörüntülenme:39
embedKaynak:https://hurriyet.com.tr
archiveBu haber kaynaktan arşivlenmiştir 23 Mayıs 2025 14:40 kaynağından arşivlendi
0 Yorum
Giriş yapın, yorum yapmak için...
Yayına ilk cevap veren siz olun...
topEn çok okunanlar
Şu anda en çok tartışılan olaylar

Körükten düşen kadın havalimanı çalışanı ağır yaralandı

11 Haziran 2025 14:23see116

Köpek otelinden kaçan Tarçın, çevre yolunda ölü bulundu

11 Haziran 2025 13:08see114

İBB soruşturmasında çarpıcı itiraf! KİPTAŞ ta vurgun ağı!

11 Haziran 2025 15:43see113

Halk TV’nin patronu hakkında yakalama kararı Yerel Gündem Haberleri

11 Haziran 2025 04:04see113

Yazıklar olsun! Türkiye Ferdi Zeyrek için tek yürek oldu, Yeni Akit haber müdürü elektrik paylaşımı yapıp dalga geçti

11 Haziran 2025 00:23see113

Çandarlı Halil Paşa idam edildi: Mehmed Fetihler Sultanı nda sezon finali VİDEO İZLE

11 Haziran 2025 00:43see112

İstanbul Photo Awards 2025 in ilk sergisi Ankara da Kültür Sanat Haberleri

11 Haziran 2025 10:57see112

Ekipleri engellemeye çalıştılar: 1.8 ton yoğurt ve peynir imhaya gitti!

11 Haziran 2025 15:24see111

Selin Yağcıoğlu nun Instagram da paylaştığı fotoğraf kriz çıkardı Sözcü Gazetesi

12 Haziran 2025 09:47see111

Los Angeles olayları, ABD nin Meksika dan aldığı bölgenin geçmişi ve etnik yapısını gündeme getirdi

11 Haziran 2025 15:41see110

Çocukların yeni tuvalet kabusu Yerel Gündem Haberleri

11 Haziran 2025 04:06see110

KIZILELMA bir testi daha geçti!

12 Haziran 2025 11:59see110

Ümit Özdağ 9 sayfalık iddianameyi satır satır çürüttü ama... Silivri’ye atılan çıkamıyor Sözcü Gazetesi

12 Haziran 2025 05:37see110

Hatice cinayetten 6 ay önce katilinden şikayetçi olmuş!

11 Haziran 2025 10:17see110

Guterres, Kolombiya da sağ partinin cumhurbaşkanı adaylarından Senatör Uribe ye suikast girişimini kınadı

11 Haziran 2025 00:00see109

Dünya durdu! Türkiye büyümede gaza bastı

11 Haziran 2025 17:45see109

Dünyada tek; tatlı su ile deniz suyunun karıştığı yerde yetişiyor

11 Haziran 2025 10:52see108

Mangal yaparken ormanı yakmış! Tutuklandı Güncel haberler

11 Haziran 2025 05:13see108

Türkiye ve Suudi Arabistan dan son dakika Gazze görüşmesi!

11 Haziran 2025 20:48see108

İSTANBUL 3. ASLİYE TİCARET MAHKEMESİ

12 Haziran 2025 00:01see108
newsSon haberler
Günün en taze ve güncel olayları