Openai meluncurkan inisiatif keselamatan besar 120 hari untuk ChatGPT, perusahaan mengumumkan Selasa, mengikuti gelombang tuntutan hukum dan protes publik yang menghubungkan AI ke bunuh diri pengguna dan hasil berbahaya lainnya. Rencana tersebut akan memperkenalkan kontrol orang tua baru dalam waktu satu bulan.
Ini memungkinkan orang tua untuk menautkan akun dengan remaja mereka dan menerima peringatan jika sistem mendeteksi tekanan akut. Openai juga akan mulai merutekan percakapan yang sensitif terhadap model penalaran yang lebih canggih untuk memberikan tanggapan yang lebih tepat.
Perombakan mendesak bertujuan untuk menambahkan pagar kritis bagi pengguna yang rentan. Ini secara langsung membahas konsekuensi dunia nyata yang parah yang telah menempatkan praktik keselamatan perusahaan di bawah pengawasan hukum dan publik yang intens.
<-h2> respones to respones to respones ke safety.jpg”> <-h2>
pengumuman adalah tindakan yang jelas dari kontrol kerusakan. Itu datang hanya seminggu setelah orang tua dari seorang anak berusia 16 tahun yang meninggal karena bunuh diri mengajukan Lawsuit terhadap openai . Gugatan itu menuduh perilaku sycophantic chatbot adalah faktor kunci dalam kematian putra mereka, dengan alasan itu memvalidasi perasaan putus asa.
Tragedi ini bukan insiden yang terisolasi. Laporan lain merinci bagaimana seorang pria berusia 56 tahun membunuh ibunya dan dirinya sendiri setelah chatgpt diduga memperkuat delusinya paranoid, seorang terapis profesional perilaku dilatih untuk dihindari. Peristiwa ini telah menciptakan krisis hukum dan hubungan masyarakat untuk pemimpin AI.
pagar baru: kontrol orang tua dan model penalaran
Pada inti dari rencana Openai adalah kontrol orang tua baru untuk pengguna berusia 13 tahun ke atas. Dalam bulan depan, orang tua dapat menautkan akun mereka ke anak remaja mereka melalui undangan email. Dasbor ini akan memungkinkan mereka untuk mengelola perilaku model yang sesuai usia dan menonaktifkan fitur seperti memori dan riwayat obrolan.
Yang terpenting, orang tua dapat memilih untuk menerima pemberitahuan ketika sistem mendeteksi remaja mereka berada pada saat”tekanan akut.”Untuk menangani percakapan sensitif ini dengan lebih baik, OpenAI akan mengarahkan mereka ke”model penalaran”yang lebih kuat, seperti GPT-5-Thinking.
Perusahaan mengatakan model canggih ini menerapkan pedoman keselamatan lebih konsisten. Inisiatif ini akan dipandu oleh”Dewan Ahli tentang Kesejahteraan dan AI”yang baru dan”jaringan dokter global”yang ada dari perusahaan yang ada lebih dari 250 dokter untuk menginformasikan penelitian keselamatan dan pelatihan modelnya.
Suatu sistem yang tidak perlu di industri ini dengan Sode Dark Side
Openai’s Crisis CRISIS. Evaluasi keselamatan gabungan baru-baru ini antara Openai dan antropik saingannya mengungkapkan”penjilat ekstrem”di kedua model paling canggih di lab. Model-model tersebut akan memvalidasi dan bahkan mendorong delusi pengguna setelah hanya pushback singkat.
Audit ini juga menemukan model Openai bersedia membantu dengan permintaan berbahaya yang disimulasikan, termasuk merencanakan serangan teroris dan pengembangan bioweapon yang diklaim oleh Backse, yang memberi tahu”. Setelah kepergiannya.
Paralel dengan raksasa teknologi lainnya tidak dapat disangkal. Meta baru-baru ini mengumumkan perombakan aturan keselamatan AI remaja sendiri setelah sebuah laporan menunjukkan chatbotnya dapat membantu remaja merencanakan bunuh diri. Advokat Keselamatan Anak Jim Steyer menyatakan, “Meta ai adalah bahaya bagi remaja dan harus segera diturunkan.”
Kegagalan itu mendorong koalisi 44 jaksa agung negara bagian untuk menyatakan bahwa mereka “secara seragam yang memberontak dengan pengabaian yang jelas ini terhadap kesejahteraan emosional anak-anak,” menyoroti alarm yang lebih jelas di antara mengatakan kepada Axios ,”Semuanya keren dan baru di internet diciptakan oleh orang dewasa dengan dalam pikiran orang dewasa, tetapi anak-anak ingin menggunakannya-dan baru di internet. Pertanyaannya sekarang adalah apakah pagar baru Openai mewakili perubahan yang tulus dalam budaya keselamatan atau hanya versi yang lebih canggih dari buku pedoman reaktif yang sama.