Google kann Webinhalte nutzen, um seine Kernsuchfunktionen zu schulen, einschließlich der KI-Übersichten, die Zusammenfassungen auf Ergebnissen generieren, selbst wenn Verlage speziell die eigenen Tools von Google verwendet hat, um diesen Inhalt von AI-Schulungen zu entscheiden, eine vor dem Bundesgericht bestätigte Firmenleiterin. href=”https://www.bloomberg.com/news/articles/2025-05-03/google-can-train-search-ai-with-web-content-even-Af-opt-out? target=”_ leer”> Freitags zugelassen, bestätigt eine Lücke zwischen Verlagabsicht und Google-Datenpraktiken für die bekanntesten AI-Anwendungen und enthüllt Einschränkungen der Kontrollmechanismen, die Website-Eigentümern angeboten haben. Befragte, dass der Hauptmechanismus Google Publishers zum Blockieren von AI-Training anbietet-eine Richtlinie namens “addiert”>”ad. Robots.txt-Datei (ein Standard, der von Webmasters zum Leitfaden von Webcrawlern verwendet wird)-schränkt nur die Daten ein, die von der Google DeepMind Research-Abteilung für Modelle wie Gemini verwendet wird. Collins bestätigte, dass die separate Google-Search-Organisation nicht den gleichen ausgetragenen Inhalt zur Verfeinerung seiner eigenen AI-gesteuerten Funktionen verwendet. Sie nehmen das Gemini”AI-Modell”und setzen es in die Suchorgür. Die Suchorgür hat die Möglichkeit, die Daten zu schulen, die Verlage vom Training abgelehnt hat, korrekt?” 

Eine bekannte Unterscheidung, die jetzt unter Kartellrecht

ist, während Collins’Zeugnis das Problem in das Kartelllicht brachte, hatte Google zuvor diese Trennung angegeben. Kurz nach der Einführung von Google-Extendended wurde das Unternehmen im Oktober 2023 , dass diese spezifische AI-Schulungskontrolle für die durchsuchten Erlebnisse nicht angewendet wurde. (AI-generierte Zusammenfassungen, die direkt auf Suchergebnisseiten angezeigt werden. Agent über Robots.txt und das NoIndex-Meta-Tag, um ihren Inhalt in Suchergebnissen zu verwalten, einschließlich Experimenten wie Suchgenerative Erfahrung.”Für Verlage. Sie verwenden möglicherweise Google-Extended in der Hoffnung, dass ihre Inhalte die allgemeine KI von Google wie Gemini ausbilden, nur um die KI-Zusammenfassungen bei der Suche möglicherweise zu fördern, dass viele Angst den direkten Verkehr auf ihre Websites reduzieren. Überblicke, obwohl dies die zugrunde liegende Verwendung der Daten für das Training nicht behandelt. href=”https://medialaws.eu/google-vs-publishers-french-competition-authority-wighs-in-on-the-online-Use-Of-Press-Publikationen-Also-in-AI-SYSTEMS-WITH-A-A-DECISISION-O-THE-THE-ERGE-OF-OF-OF-OF-OF-OF-OF-OF-OF-OF-ONTRUBTE-ANTRUBRUBISCHE-AN-COPYRIGHT/”agrog=”agrog=”agrog=”agrog=”agrog=”acright KI-Datenpraktiken und das Fehlen eines effektiven Opt-Outs, der die Sichtbarkeit einer Website in den regulären Suchergebnissen nicht gleichzeitig schädlich. Zahlreiche Verlage und Mediengruppen haben Alarm oder Maßnahmen ergriffen, z. Cloudflare im März startete AI Labyrinth, ein System, das nicht autorisierte KI-Krabbel-Bots irreführte, indem sie sie in automatisch generierten Inhalten fangen, um Publishers eine zusätzliche Option anzubieten. Ein hochkarätiger Fall gegen OpenAI und Microsoft wegen angeblicher weit verbreiteter Urheberrechtsverletzung. Übersetzen, Bard-und Cloud-KI-Funktionen.”Google hat im Februar 2024 auch einen gemeldeten Jahresvertrag über 60 Millionen US-Dollar mit Reddit sichergestellt.

Die Datenskala ist immens. Ein internes Google-Dokument, auf das sich das Zeugnis von Collins bezieht, ergab, dass die Anwendung von Verlag-Opt-Outs (über Google-erweiterte) 80 Milliarden Inhalte „Token“ (Teile von Textdaten, die für das Training verwendet wurden) aus einem 160-Milliarden-Token-Datensatz für das Tiefentraining für das Tiefengebäude aus dem Aufbau von GOOK-Eingängen für den Eindruck von Publisher-Eingängen ausgezeichnet wurden. DeepMind-CEO Demis Hassabis über den potenziellen Wert der Verwendung von Google-Suchdaten, einschließlich der Ranglistensignale, um die Leistung der KI-Modells weiter zu verbessern, wie von Bloomberg berichtet. Richter Amit Mehta, der Google bereits illegal sein Suchmonopol beibehalten hatte, muss nun über die vorgeschlagenen Korrekturen des DOJ entscheiden. Dazu gehören potenziell den Verkauf des Chrombrowsers und das Verbot der Arten exklusiver Standard-Platzierungsangebote (einschließlich AI wie Gemini), die zur Dominanz von Google beigetragen haben. Verhalten. CEO Sundar Pichai argumentierte stark gegen die Heilmittel des DOJ und bezeichnete die Anforderungen von Datenaustausch als „De-facto-Veräußerung der Suche“, die die Fähigkeit des Unternehmens, Forschung und Entwicklung zu finanzieren, untergraben würde. Eine Entscheidung von Richter Mehta über die Kartellmittel wird später in diesem Jahr erwartet.

Categories: IT Info