Apple telah memperkenalkan sistem AI yang direka untuk memamerkan ulasan pengguna di App Store, yang bertujuan untuk memberi pengguna maklum balas yang cepat. Mengakui bahawa”penilaian dan ulasan adalah sumber yang tidak ternilai untuk pengguna meneroka aplikasi di kedai aplikasi, memberikan pandangan tentang bagaimana orang lain telah mengalami aplikasinya,”
Inisiatif ini mengikuti prinsip-prinsip dalaman yang mengutamakan keselamatan, keadilan, kebenaran, dan kebijaksanaan. Menangani kandungan yang dihasilkan oleh pengguna seperti ulasan aplikasi memberikan kesukaran yang unik. Apple secara khusus mengenal pasti keperluan untuk ringkasan untuk kekal semasa walaupun kemas kini aplikasi berterusan (ketepatan masa), untuk menangkap pelbagai gaya dan bahan ulasan (kepelbagaian), dan menapis kenyataan yang tidak relevan atau luar topik untuk mengekalkan kebolehpercayaan (ketepatan). Untuk memastikan relevan, ringkasan disegarkan sekurang-kurangnya sekali seminggu.
Mengekodkan maklum balas pengguna dengan AI
Sistem Apple yang dibina menangani isu-isu ini melalui aliran kerja berstruktur dengan teliti. Ia bermula dengan menapis ulasan mentah untuk mengecualikan spam, bahasa yang menyinggung, dan jawatan penipuan. Ulasan yang layak kemudian masukkan saluran paip yang dikuasai oleh pelbagai model AI LLMS-kompleks yang mahir dalam memproses dan menghasilkan teks seperti manusia. Aplikasi mesti mengumpulkan jumlah ulasan pengguna yang mencukupi sebelum ringkasan dapat dihasilkan, walaupun Apple belum menetapkan ambang yang tepat.
Hanya subset kecil parameter model yang besar-menyenaraikan setiap kajian ke dalam”pandangan”asas. Apple menerangkan unit-unit yang ditakrifkan dengan teliti ini:”Setiap wawasan adalah pernyataan atom, merangkumi satu aspek khusus kajian, yang dinyatakan dalam bahasa yang diseragamkan, semula jadi, dan terhad kepada satu topik dan sentimen.”Perwakilan berstruktur ini membolehkan perbandingan dan pengagregatan yang lebih mudah merentasi banyak ulasan.
Berikutan pengekstrakan wawasan, satu lagi model bahasa yang ditala khas melakukan pemodelan topik dinamik. Model ini memaparkan pandangan yang sama ke dalam tema dan menghasilkan nama topik standard tanpa bergantung pada senarai yang telah ditetapkan, tetap atau taksonomi.
Ia menggunakan teknik seperti embeddings (perwakilan berangka teks) dan corak yang sepadan untuk menggabungkan topik yang berkaitan dengan semantik dan menyumbang variasi. Model ini juga membezakan antara maklum balas yang berkaitan secara langsung dengan”pengalaman aplikasi”(seperti ciri atau prestasi) dan komen”pengalaman keluar-app”(seperti pendapat mengenai kualiti makanan untuk aplikasi penghantaran), mengutamakan bekas untuk relevan dalam ringkasan. Pemilihan ini mengutamakan populariti topik tetapi juga menggabungkan kriteria untuk keseimbangan, kaitan, kegunaan, dan kesegaran. Ia mengesahkan bahawa sentimen keseluruhan yang dicerminkan dalam maklumat yang dipilih sejajar dengan pengagihan penarafan umum aplikasi.
Secara penting, bukan hanya menggunakan nama topik, sistem memilih pandangan yang paling mewakili yang berkaitan dengan topik-topik ini untuk memberi makan kepada langkah penjanaan ringkasan akhir. Apple menjelaskan pilihan ini memberikan perspektif yang lebih semulajadi yang diperoleh secara langsung dari komen pengguna, menghasilkan ringkasan yang lebih ekspresif dan kaya dengan terperinci. Model ini pada mulanya dilatih pada satu set ringkasan rujukan yang ditulis oleh pakar manusia. Ia kemudiannya ditapis lagi dengan menggunakan pengoptimuman keutamaan langsung ( dpo ), satu kaedah untuk menjajarkan output model dengan pembelajaran secara langsung dari
LLM akhir ini menghasilkan perenggan antara 100 dan 300 aksara, disesuaikan dengan gaya, suara, dan komposisi yang dikehendaki Apple. Pemprosesannya kelihatan berasaskan awan, memandangkan ringkasan adalah konsisten merentasi peranti yang berbeza, menunjukkan ia tidak bergantung semata-mata pada keupayaan kecerdasan Apple yang berpotensi hadir pada perkakasan yang lebih baru.
Pengawal manusia mengkaji semula ribuan ringkasan sampel terhadap empat kriteria utama: keselamatan (memeriksa kandungan yang berbahaya atau menyinggung perasaan), tanah (memastikan perwakilan yang setia dalam ulasan input), komposisi (menilai tatabahasa dan kepatuhan kepada gaya Apple), dan membantu (menentukan jika ia membantu keputusan muat turun pengguna). A
Menurut Apple, mencapai penarafan keselamatan yang tinggi memerlukan persetujuan sebulat suara dari penilai, sementara tiga kriteria lain didasarkan pada perjanjian majoriti. Automasi membantu dalam bahagian penilaian ini, mengarahkan kepakaran manusia dengan berkesan. Untuk mengendalikan penyelenggaraan kualiti yang berterusan, kedua-dua pengguna dan pemaju boleh melaporkan ringkasan yang bermasalah terus ke Apple melalui antara muka App Store atau App Store Connect.
Pelancaran awal menyasarkan ulasan bahasa Inggeris untuk bilangan aplikasi yang terhad di Amerika Syarikat, dengan pelan yang menyatakan bahawa (Pada tahun 2024). Mempamerkan aplikasi LLM untuk menguruskan kandungan pengguna volum tinggi.