Apple hat ein KI-System eingeführt, das die Benutzerbewertungen im App Store verdichtet hat, um den Benutzern eine schnelle Verdauung von Feedback zu bieten. Anerkennung, dass „Bewertungen und Bewertungen eine unschätzbare Ressource für Benutzer sind, die eine App im App Store erforschen und Einblicke in die Erfahrung der App geben. In iOS 18.4 Beta-Veröffentlichungen im März und jetzt öffentlich verfügbar, analysiert das System die große Anzahl von Kommentaren, die Apps erhalten, um Zusammenfassungen zu generieren. Diese Zusammenfassungen werden direkt über dem Abschnitt einzelner Benutzerbewertungen auf der Seite einer App angezeigt, wobei Benutzer dabei helfen, fundiertere Entscheidungen zu treffen. src=”https://winbuzer.com/wp-content/uploads/2025/04/apple-app-store-ai-review-summaries.webp”>

Die Initiative folgt interne Prinzipien, die Sicherheit, Fairness, Wahrhaftigkeit und Hilfsmaßnahmen vorrücken. Die Bekämpfung von benutzergenerierten Inhalten wie App-Bewertungen zeigt einzigartige Schwierigkeiten. Apple identifizierte ausdrücklich die Notwendigkeit, dass Zusammenfassungen trotz konstanter App-Aktualisierungen (Aktualität), um die unterschiedlichen Stile und die Substanz von Überprüfungen (Vielfalt) zu erfassen und irrelevante oder off-topische Bemerkungen zur Aufrechterhaltung der Zuverlässigkeit (Genauigkeit) zu erfassen. Um die Relevanz zu gewährleisten, werden die Zusammenfassungen mindestens einmal pro Woche aktualisiert. Es beginnt damit, rohe Bewertungen zu filtern, um Spam, Offensivsprache und betrügerische Beiträge auszuschließen. Anspruchsberechtigte Bewertungen geben dann eine Pipeline ein, die von mehreren LLMs angetrieben wird-Complex AI-Modelle, die in der Verarbeitung und Erzeugung von menschlichem Text geschickt sind. Eine App muss eine ausreichende Anzahl von Benutzerbewertungen angesammelt haben, bevor eine Zusammenfassung erstellt werden kann, obwohl Apple den genauen Schwellenwert nicht angegeben hat. Verändert nur eine kleine Untergruppe der Parameter eines großen Modells-stellt jede Überprüfung in grundlegende „Erkenntnisse“ ein. Apple beschreibt diese sorgfältig definierten Einheiten: „Jede Einsicht ist eine atomare Aussage, die einen spezifischen Aspekt der Überprüfung zusammenfasst, der in standardisierter, natürlicher Sprache artikuliert und auf ein einzelnes Thema und ein einziges Gefühl beschränkt ist.“ Diese strukturierte Darstellung ermöglicht einen einfacheren Vergleich und Aggregation über zahlreiche Überprüfungen. Dieses Modell gruppiert ähnliche Einblicke in Themen und generiert standardisierte Themennamen, ohne sich auf eine vordefinierte, feste Liste oder Taxonomie zu verlassen. Dieses Modell unterscheidet auch zwischen dem Feedback, der direkt mit den Kommentaren „App-Erlebnis“ (wie Funktionen oder Leistung) und „Out-of-App-Erlebnis“ (wie Meinungen zur Lebensmittelqualität für eine Liefer-App) im Zusammenhang mit der Relevanz in der Zusammenfassung priorisiert. Diese Auswahl priorisiert die Beliebtheit der Themen, enthält jedoch auch Kriterien für Gleichgewicht, Relevanz, Nützlichkeit und Frische. Es wird überprüft, dass sich das in den ausgewählte Informationen widersprüchende Gesamtgefühl mit der allgemeinen Bewertungsverteilung der App übereinstimmt. Apple erklärte, dass diese Wahl eine natürlichere Perspektive liefert, die direkt von Benutzern Kommentaren abgeleitet wurde, was zu Zusammenfassungen führt, die ausdrucksvoller und reicher sind. Dieses Modell wurde ursprünglich auf einem großen Satz von Referenzzusammenfassungen von menschlichen Experten ausgebildet. Anschließend wurde es mit der direkten Präferenzoptimierung ( dpo ) weiter verfeinert.

Diese endgültige LLM erzeugt einen Absatz zwischen 100 und 300 Zeichen, der auf den gewünschten Stil, die Stimme und die Komposition von Apple zugeschnitten ist. Die Verarbeitung scheint Cloud-basiert zu sein, da die Zusammenfassungen über verschiedene Geräte hinweg konsistent sind, was darauf hindeutet, dass sie nicht nur auf die Funktionen von Apple Intelligence in On-Device in neuerer Hardware beruht. Humane Bewerter überprüften Tausende von Stichprobenzusammenfassungen gegen vier Schlüsselkriterien: Sicherheit (Überprüfung auf schädliche oder beleidigende Inhalte), Grundnutzung (Gewährleistung der treuen Darstellung von Eingabebestimmungen), Komposition (Bewertung von Grammatik und Einhaltung von Apples Stil) und Hilfsbereitschaft (festzustellen, ob es Benutzer laden, Entscheidungen herunterzuladen). Ein

Nach Angaben von Apple erforderte das Erreichen einer hohen Sicherheitsbewertung einstimmige Übereinstimmung von den Bewertern, während die anderen drei Kriterien auf der Mehrheitsvereinbarung beruhten. Die Automatisierung hilft in Teilen dieser Bewertung und leitet menschliches Know-how effektiv. Um die laufende Qualitätswartung zu bewältigen, können sowohl Benutzer als auch Entwickler problematische Zusammenfassungen über die App Store-Schnittstelle oder den App Store Connect direkt an Apple melden. 2024).

Während einige Kommentatoren diese Art der KI-Zusammenfassung als relativ unkomplizierte „niedrig hängende Früchte“ mit klaren Benutzernvorteilen betrachten, gibt es potenzielle Bedenken, dass Zusammenfassungen, die durch gefälschte Bewertungen manipuliert werden, oder möglicherweise von der Nutzung von Benutzern, die sich mit detaillierteren Feedbacks befassen, manipuliert werden. Die Anwendung von LLMs zur Verwaltung von Benutzerinhalten mit hohem Volumen.

Categories: IT Info