Az
Apple bevezette egy AI rendszert, amelynek célja a felhasználói vélemények kondenzálása az App Store-ban, azzal a céllal, hogy a felhasználók számára a visszajelzések gyors emésztése legyen. Annak elismerése, hogy a „besorolások és áttekintések felbecsülhetetlen értékű forrás a felhasználók számára az App Store-ban alkalmazott alkalmazások feltárására, betekintést nyújtva arra, hogy mások hogyan tapasztalták meg az alkalmazást”.
először az iOS 18.4 béta-kiadásában március körül látható, és most nyilvánosan elérhető, a rendszer elemzi a hatalmas mennyiségű kommentár alkalmazást az összefoglalók létrehozása érdekében. Ezek az összefoglalók közvetlenül az alkalmazás oldalán az egyes felhasználói áttekintések szakaszán jelennek meg, segítve a felhasználókat megalapozottabb döntések meghozatalában. src=”https://winbuzzer.com/wp-content/uploads/2025/04/apple-app-store-ai-review-summaries.webp”>
A kezdeményezés a belső alapelveket követi, a biztonságot, a méltányosságot és a segítőkészséget. A felhasználó által generált tartalom, például az alkalmazás-áttekintések kezelése egyedi nehézségeket jelent. Az Apple kifejezetten meghatározta annak szükségességét, hogy az összefoglalók továbbra is aktuálisak maradjanak az állandó alkalmazásfrissítések (időszerűség) ellenére, rögzítsék az áttekintések (sokféleség) változatos stílusait és lényegét, valamint kiszűrjék a irreleváns vagy a témán kívüli megjegyzéseket a megbízhatóság (pontosság) fenntartása érdekében. A relevancia biztosítása érdekében az összefoglalókat hetente legalább egyszer frissítik. A nyers áttekintések szűrésével kezdődik a spam, a sértő nyelv és a csalárd hozzászólások kizárása érdekében. A támogatható vélemények ezután írnak be egy csővezetéket, amelyet több LLM-rel hajtanak végre-az Complex AI modellek hozzáadtak az emberiszerű szöveg feldolgozásához és generálásához. Az alkalmazásnak elegendő számú felhasználói véleményt kellett összegyűjtenie, mielőtt összefoglalást lehet létrehozni, bár az Apple nem határozta meg a pontos küszöböt. Csak egy kis modell paramétereinek csak egy kis részhalmazát módosítja-az egyes áttekintéseket alapvető „betekintésbe”. Az Apple leírja ezeket a gondosan meghatározott egységeket: „Minden betekintés egy atomi nyilatkozat, amely a felülvizsgálat egyik konkrét aspektusát magában foglalja, a szabványosított, természetes nyelven fogalmazva, és egyetlen témára és érzelmekre korlátozódik.”Ez a strukturált ábrázolás lehetővé teszi a könnyebb összehasonlítást és az aggregációt számos áttekintés során. Ez a modellcsoportok hasonló betekintést nyújtanak a témákba, és szabványosított témameneveket generálnak anélkül, hogy támaszkodnának egy előre definiált, rögzített listára vagy taxonómiára. Ez a modell megkülönbözteti a közvetlenül az „alkalmazás élményével” (például a szolgáltatások vagy a teljesítmény) és a „alkalmazáson kívüli tapasztalatok” megjegyzéseit (például a kézbesítési alkalmazás élelmezési minőségéről szóló vélemények), az előzőek relevanciájának prioritása az összefoglaló relevanciájának prioritása. Ez a kiválasztás prioritást élvez a téma népszerűségének, de magában foglalja az egyensúly, a relevancia, a hasznosság és a frissesség kritériumait is. Ellenőrzi, hogy a kiválasztott információkban tükröződött általános érzés összhangban áll-e az alkalmazás általános besorolási eloszlásával. Az Apple elmagyarázta, hogy ez a választás egy természetesen megfogalmazott perspektívát nyújt közvetlenül a felhasználói megjegyzésekből, amelyek olyan összefoglalókat eredményeznek, amelyek kifejezőbbek és részletesebbek. Ezt a modellt kezdetben egy nagy referenciakereskedelemre képzették, amelyeket az emberi szakértők írtak. Ezt követően tovább finomítottuk a közvetlen preferencia-optimalizálás alkalmazásával ( dpo ), ez a módszer a modell kimenetének összehangolására az emberi ítéletekhez, az előnyben részesített, az emberi szerzõknek a tanulásra, az emberi szerzõkből való tanulással.
Ez a végső LLM 100 és 300 karakter közötti bekezdést generál, az Apple kívánt stílusához, hangjához és összetételéhez igazítva. Úgy tűnik, hogy a feldolgozás felhőalapúnak tűnik, mivel az összefoglalók a különböző eszközökön konzisztensek, ami azt sugallja, hogy ez nem támaszkodik kizárólag az eszközön az Apple intelligencia képességeire, amelyek potenciálisan jelen vannak az újabb hardveren. Az emberi értékelők több ezer minta-összefoglalót vizsgáltak meg négy kulcsfontosságú kritérium ellen: a biztonság (a káros vagy sértő tartalom ellenőrzése), a megalapozottság (a bemeneti áttekintések hű ábrázolásának biztosítása), a kompozíció (a nyelvtan értékelése és az Apple stílusának betartása) és a segítőkészség (meghatározása, hogy segíti-e a felhasználói letöltési döntéseket). A
Az Apple szerint a magas biztonsági minősítést elérve egyhangú megállapodást igényelt az értékelőktől, míg a másik három kritérium többségi megállapodáson alapult. Az automatizálás az értékelés egyes részein segíti az emberi szakértelem hatékony irányítását. A folyamatban lévő minőségi karbantartás kezelése érdekében mind a felhasználók, mind a fejlesztők közvetlenül az App Store felületen vagy az App Store Connect-en keresztül jelenthetnek problematikus összefoglalókat az Apple-hez. 2024). Az LLM-ek alkalmazásának bemutatása a nagy volumenű felhasználói tartalom kezelésére.