Selepas berminggu-minggu aduan pengguna dan spekulasi mengenai penurunan prestasi AI, antropik telah memecahkan kesunyiannya.”Kami tidak pernah mengurangkan kualiti model kerana permintaan, masa hari, atau beban pelayan. Masalah yang dilaporkan pengguna kami disebabkan oleh bug infrastruktur sahaja.”di platform dan telah mula
Isu kecil ini secara dramatik diperkuat oleh perubahan beban pada 29 Ogos. Pada puncaknya, kesilapan itu memberi kesan 16% daripada permintaan Sonnet 4. Masalahnya dikompaun oleh”Routing Sticky,”yang mengunci pengguna yang terjejas ke dalam sesi dengan pelayan yang rosak, menjadikan prestasi yang buruk merasa berterusan.
Kebolehpercayaan platform.
Di bawah tudung: lata tiga pepijat bertindih
Penyiasatan Anthropic menemui ribut kegagalan teknikal yang sempurna. Pada 25 Ogos, dua lagi pepijat telah digunakan. href=”https://cloud.google.com/tpu/docs/intro-to-tpu”target=”_ blank”> xla: tpu compiler . Kod menulis semula yang bertujuan untuk meningkatkan ketepatan dalam persampelan token secara tidak sengaja mencetuskan kecacatan ini. Titik punca akar tunggal.
Pengalaman untuk banyak adalah bahawa alat yang berubah-ubah sekali-kali telah menjadi tidak boleh dipercayai. Dalam postmortemnya, syarikat itu menjelaskan bahawa”isu-isu ini terdedah jurang kritikal.”Penilaian semata-mata tidak menangkap kegagalan tertentu pengguna telah melaporkan.
Cabaran utama berpunca daripada daya tahan model sendiri. Claude sering pulih dengan baik dari kesilapan terpencil, yang secara berkesan menutupi drift sistemik yang disebabkan oleh pepijat yang mendasari. Langkah-langkah keselamatan ini mengehadkan akses jurutera kepada interaksi pengguna, menghalang mereka daripada dengan mudah memeriksa arahan tertentu dan perbualan yang diperlukan untuk menghasilkan semula pepijat. Ini menjadikan masalah ini kelihatan seperti kemerosotan rawak, tidak konsisten dan bukannya satu siri kegagalan yang berkaitan dengan konkrit.
Jurutera telah membetulkan logik penghalaan yang rosak, melancarkan semula kod yang menyebabkan rasuah output, dan beralih dari kaedah pensampelan”anggaran”yang lebih baik. Penilaian yang direka untuk membezakan lebih baik antara model kerja dan rosak. Secara kritikal, pemeriksaan kualiti ini kini akan berjalan secara berterusan pada sistem pengeluaran langsungnya untuk menangkap kesilapan dalam masa nyata. dalam perlumbaan AI Arms yang kompetitif. Bagi antropik, kepentingannya sangat tinggi kerana ia menolak melampaui model asas ke dalam platform sebagai lapisan perkhidmatan (PAAS), bersaing secara langsung dengan penyedia perkhidmatan awan dan perisian. Dalam siaran seperti model claude 4 yang agentik dan alat pemaju seperti sub-agen, menjadikan kebolehpercayaan platform sebagai ciri yang tidak boleh dirunding.
Visi, seperti yang diartikulasikan oleh Ketua Falsafah armada AI yang diuruskan oleh manusia menjadi realiti, tetapi ia bergantung sepenuhnya pada kestabilan alat yang mendasari.
Reaksi masyarakat terhadap postmortem telah bercampur. Walaupun banyak pemaju di forum seperti reddit
Pada akhirnya, penjelasan terperinci antropik adalah langkah penting. Ia mengakui pengalaman mengecewakan pengguna dan memberikan naratif teknikal yang boleh dipercayai untuk kegagalan. Syarikat itu bertaruh bahawa tahap ketelusan ini, digabungkan dengan penambahbaikan yang dirancang, akan cukup untuk memulihkan keyakinan dalam platform Claude.