Apple telah memperkenalkan sistem AI yang dirancang untuk mengembun ulasan pengguna di App Store, yang bertujuan untuk memberi pengguna dengan umpan balik yang cepat. Mengakui bahwa “Peringkat dan Ulasan adalah sumber daya yang sangat berharga bagi pengguna yang mengeksplorasi aplikasi di App Store, memberikan wawasan tentang bagaimana orang lain telah mengalami aplikasi tersebut,” kata the fitur.
Pertama kali terlihat di iOS 18.4 rilis beta sekitar bulan Maret dan sekarang tersedia untuk umum, sistem menganalisis sejumlah besar aplikasi komentar yang diterima untuk menghasilkan ringkasan. Ringkasan ini muncul langsung di atas bagian ulasan pengguna individu pada halaman aplikasi, membantu pengguna membuat keputusan yang lebih terinformasi.
Perusahaan menguraikan tujuannya untuk fitur, menyatakan,”Tujuan kami dalam memproduksi ringkasan ulasan adalah untuk memastikan mereka inklusif, seimbang, dan secara akurat mencerminkan suara pengguna.”
Inisiatif ini mengikuti prinsip-prinsip internal yang memprioritaskan keselamatan, keadilan, kebenaran, dan bantuan. Menangani konten yang dibuat pengguna seperti ulasan aplikasi menghadirkan kesulitan yang unik. Apple secara khusus mengidentifikasi perlunya ringkasan agar tetap terjadi saat ini meskipun ada pembaruan APP yang konstan (ketepatan waktu), untuk menangkap berbagai gaya dan substansi ulasan (keanekaragaman), dan untuk menyaring komentar yang tidak relevan atau di luar topik untuk mempertahankan keandalan (akurasi). Untuk memastikan relevansi, ringkasannya disegarkan setidaknya sekali seminggu.
decoding umpan balik pengguna dengan AI
Sistem yang dibangun oleh Apple membahas masalah ini melalui alur kerja yang terstruktur dengan cermat. Ini dimulai dengan memfilter ulasan mentah untuk mengecualikan spam, bahasa ofensif, dan posting penipuan. Ulasan yang memenuhi syarat kemudian memasuki pipa yang ditenagai oleh beberapa LLM-model AI complex yang mahir dalam memproses dan menghasilkan teks seperti manusia. Suatu aplikasi harus telah mengumpulkan sejumlah ulasan pengguna yang cukup sebelum ringkasan dapat dihasilkan, meskipun Apple belum menentukan ambang batas yang tepat.
Pertama, sebuah llm disempurnakan menggunakan adaptasi peringkat rendah (
Mengikuti ekstraksi wawasan, model bahasa yang disetel khusus lainnya melakukan pemodelan topik dinamis. Model ini mengelompokkan wawasan serupa tentang tema dan menghasilkan nama topik terstandarisasi tanpa mengandalkan pada daftar atau taksonomi tetap yang telah ditentukan sebelumnya. Menggunakan teknik seperti embeddings (representasi numerik teks) dan pencocokan pola untuk menggabungkan topik yang terkait secara semantik dan memperhitungkan variasi ungkapan. This model also distinguishes between feedback related directly to the “App Experience”(like features or performance) and “Out-of-App Experience”comments (such as opinions on food quality for a delivery app), prioritizing the former for relevance in the summary. Once topics are identified, the system selects a set for summarization. Pilihan ini memprioritaskan popularitas topik tetapi juga menggabungkan kriteria untuk keseimbangan, relevansi, kegunaan, dan kesegaran. Ini memverifikasi bahwa sentimen keseluruhan yang tercermin dalam informasi yang dipilih selaras dengan distribusi peringkat umum aplikasi. Yang terpenting, alih-alih menggunakan hanya nama topik, sistem memilih wawasan yang paling representatif yang terkait dengan topik ini untuk dimasukkan ke dalam langkah pembuatan ringkasan akhir. Apple menjelaskan pilihan ini memberikan perspektif yang lebih alami yang diperoleh langsung dari komentar pengguna, menghasilkan ringkasan yang lebih ekspresif dan kaya detail. LLM ketiga, juga disesuaikan dengan adaptor Lora, membuat ringkasan akhir. Model ini awalnya dilatih pada serangkaian ringkasan referensi besar yang ditulis oleh para ahli manusia. Itu kemudian disempurnakan lebih lanjut menggunakan optimasi preferensi langsung ( dpo ), metode untuk menyelaraskan output dengan penilaian manusia dengan mempelajari langsung dari yang lebih disukai versus respons yang tidak disukai, fokus fokus, fokus fokus output dengan penilaian manusia dengan mempelajari langsung dari tanggapan respons yang tidak disukai, fokus fokus, fokus fokus, fokus fokus, fokus fokus, fokus, fokus, fokus, fokus, fokus, fokus, fokus, fokus, fokus pada resep fokus, fokus fokus, fokus fokus, fokus pada rekan-rekan fokus, fokus fokus, fokus fokus, fokus, fokus, fokus, fokus, LLM terakhir ini menghasilkan paragraf antara 100 dan 300 karakter, disesuaikan dengan gaya, suara, dan komposisi Apple yang diinginkan. Pemrosesan tampaknya berbasis cloud, mengingat bahwa ringkasan konsisten di berbagai perangkat, menunjukkan bahwa itu tidak hanya bergantung pada kemampuan intelijen Apple yang berpotensi ada pada perangkat keras yang lebih baru. Apple merinci proses evaluasi multi-facet untuk menilai kualitas yang menilai. Penilai manusia meninjau ribuan ringkasan sampel terhadap empat kriteria utama: Keselamatan (memeriksa konten yang berbahaya atau menyinggung), groundedness (memastikan representasi yang setia dari tinjauan input), komposisi (mengevaluasi tata bahasa dan kepatuhan terhadap gaya Apple), dan bantuan (menentukan apakah itu membantu keputusan unduhan pengguna). A Menurut Apple, mencapai peringkat keselamatan yang tinggi membutuhkan kesepakatan bulat dari penilai, sementara tiga kriteria lainnya didasarkan pada perjanjian mayoritas. Otomasi membantu di beberapa bagian evaluasi ini, mengarahkan keahlian manusia secara efektif. Untuk menangani pemeliharaan kualitas yang berkelanjutan, baik pengguna maupun pengembang dapat melaporkan ringkasan yang bermasalah langsung ke Apple melalui antarmuka App Store atau Connect Store App. Peninjauan bahasa Inggris yang ditargetkan dengan peluncuran awal untuk lebih banyak bahasa dan review 225. 2024). Sementara beberapa komentator memandang jenis ringkasan AI ini sebagai”buah yang bergantung pada rendah”yang relatif mudah dengan manfaat pengguna yang jelas, ada masalah potensial tentang ringkasan yang dimanipulasi oleh ulasan palsu atau mungkin mengecilkan hati pengguna untuk melibatkan pujian yang lebih rinci. Namun, Apple menekankan bahwa pengpuriannya dengan rangkaian workfuling. Aplikasi LLM untuk mengelola konten pengguna volume tinggi. Generating Concise Overviews
Kontrol kualitas dan konteks