Web Security Giant Cloudflare ha acusado a la perplejidad de la firma de búsqueda de IA de usar”rastreadores sigilosos”engañosos para evitar las reglas del sitio web y raspar contenido. En un informe, la perplejidad de Cloudflare enmascara sus bots con identidades genéricas del navegador para ignorar los bloques del editor.
citando una violación de la confianza de Internet, Cloudflare ha eliminado la perplejidad de su programa BOT verificado y ahora está bloqueando activamente el comportamiento. Este movimiento marca una gran escalada en la lucha entre las compañías de IA y los creadores de contenido, lo que coloca la estrategia de crecimiento agresiva de la perplejidad bajo un intenso escrutinio.
Cloudflare acusa a la perplejidad de”rastreo sigiloso”
la investigación de Cloudflare, detallada, detallada en un 4 de agosto publica de blog , fue solicitado por las quejas de los clientes. Estos usuarios informaron que a pesar de implementar directivas `robots.txt` y reglas específicas de firewall para bloquear los rastreadores declarados oficialmente de Perplexity,’PerplexityBot` y` Perplexity-User’, su contenido todavía estaba siendo accedido por el Servicio AI. src=”https://winbuzzer.com/wp-content/uploads/2025/05/perplexity-pro-labs.jpg”>
La firma de seguridad alega que la perplejidad emplea un enfoque de dos puntas. Cuando sus rastreadores declarados están bloqueados, la compañía parece implementar bots no declarados que se hacen pasar por los navegadores web estándar. Estos rastreadores sigilosos se observaron girando a través de direcciones IP no listadas e incluso cambiando sus sistemas autónomos de origen (ASNS) en lo que CloudFlare describe como un intento deliberado de ocultar su actividad y eludir las preferencias del editor.
El agente de usuario principal identificado en esta actividad sigilosa fue Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) Applewebkit/537.36.36.36.36.36.36.36.36.36.36.36.36.36.36.36 (KHTML, como gecko) Chrome/124.0.0.0 Safari/537.36. Esta cadena genérica está diseñada para combinarse con el tráfico humano normal desde un dispositivo MacOS que usa Chrome, lo que dificulta la bloquea sin afectar potencialmente a los usuarios legítimos. Cloudflare argumenta que este comportamiento viola las normas de rastreo web establecidas, como las descritas en RFC 9309.
Para confirmar este comportamiento, el equipo de Cloudflare realizó un experimento controlado. Registraron nuevos dominios no indebidos que no se podían descubrir públicamente y colocaron un archivo `robots.txt` altamente restrictivo en ellos, no permitiendo a todos los rastreadores. A pesar de estas precauciones, cuando consultaban la IA de la perplejidad sobre el contenido secreto en estos dominios, el servicio proporcionó resúmenes detallados y precisos, lo que indica que había omitido con éxito los bloques.
El autor del informe, Gabriel Corral, declaró,”estamos observando el comportamiento de rastreo de sigilo de la perplexidad… Aparecen su identidad en un intento de la identidad en un intento en un intento de la sensación de circuito”. Cloudflare señaló que esta actividad se observó a través de decenas de miles de dominios, que ascendieron a millones de solicitudes por día, y que estaba utilizando el aprendizaje automático para hacer huellas dactilares y rastrear al rastreador evasivo.
en su informe, Cloudflare contrastó este comportamiento con el de OpenAi. Durante pruebas similares, el rastreador `chatgpt-user` de OpenAI obtuvo correctamente el archivo` robots.txt` y dejó de actividad cuando estaba no permitido. También respetaba bloques a nivel de red, que CloudFlare describió como la”respuesta apropiada”para un operador de BOT de bienestar que actúa de buena fe.
Un patrón de controversia y retroceso de retroceso
Este no es el primer tiempo perplejo de la Cloud. En junio de 2024, el desarrollador Robb Knight documentó en detalle cómo la firma de IA raspó sus sitios, Radweb y MacStories, a pesar de que implementaba ambas reglas `robots.txt` y bloques de nivel de servidor más estrictos utilizando NGINX. Knight descubrió que el bot no estaba utilizando su identificador declarado, sino más bien un agente genérico de usuarios para evitar sus defensas.
Las prácticas de la compañía también han atraído las amenazas legales de las principales organizaciones de medios. En junio de 2025, la BBC amenazó a acciones legales sobre la infracción de los derechos de autor y el daño de reputación, alegando que la perplejidad reprodujo su periodismo literalmente. La perplejidad emitió una fuerte refutación, calificó las afirmaciones”manipulativas”y acusó al emisor de intentar proteger el dominio del mercado de Google. Esto se une a una creciente lista de desafíos legales de editores como el New York Times y News Corp.
Este conflicto se desarrolla en un contexto de lo que muchos editores ven como una crisis. El CEO de Cloudflare, Matthew Prince, ha calificado la disminución del tráfico de referencias de la búsqueda de IA, una”amenaza existencial”, revelando que la relación de páginas raspadas por la IA de Anthrope a los visitantes enviados de regreso había cratado a 60,000 a uno. Este sentimiento se hizo eco de la directora ejecutiva de News/Media Alliance, Danielle Coffey, quien declaró:”Los enlaces fueron la última calidad de búsqueda redentora que dio a los editores tráfico e ingresos. Ahora Google solo toma contenido por la fuerza y lo usa sin regreso”. Antes de su última acción contra la perplejidad, la compañía ya había desplegado contramedidas sofisticadas. Estos incluyen”AI Labyrinth”, una herramienta de engaño que atrapa a los bots no conformes en un laberinto de contenido falso para desperdiciar sus recursos y”Pague por rastreo”, un sistema que permite que los sitios cobren por el acceso reviviendo la larga duración HTTP 402″Pague”Código de estado requerido. Desestimando la idea de que las empresas de IA son demasiado poderosas para detenerse, bromeó:”Y me estás diciendo, no puedo detener a un nerd con una corporación C en Palo Alto?”
La dual narrativa: el crecimiento explosivo en medio de escrutinio ético
las contrastras de contrasta de la perplexidad. Según los informes, la valoración de la startup se elevó a $ 18 mil millones en julio de 2025, un salto masivo desde sus cifras de principios de 2024. Este crecimiento se ve impulsado por una estrategia de expansión agresiva.
La perplejidad ha lanzado un conjunto de productos premium, incluida una suscripción”MAX”de $ 200/mes y su propio navegador AI”Comet”. El CEO Aravind Srinivas prometió que Comet entregaría”mejoras básicas de navegación que Chrome no ha enviado para edades”, enmarcarlo como un”socio de pensamiento”para los usuarios.
La compañía también está buscando acuerdos masivos de adquisición de usuarios. Una asociación reciente con el gigante de las telecomunicaciones de la India Airtel ofrecerá un año gratuito de Perpleity Pro a 360 millones de clientes, un movimiento audaz para capturar un mercado clave. Esto sigue un acuerdo similar con Motorola, aunque eso estaba limitado por los contratos antimonopolio de Google.
Sin embargo, esta rápida expansión se acompaña de otras preocupaciones. Una auditoría de seguridad de abril de 2025 por Appknox marcó las”vulnerabilidades críticas”en la aplicación Android de Perplexity.
Una guerra más amplia sobre el futuro de la Web
El choque entre Cloudflare y Perplexity destaca una tensión fundamental en el efectivo de AI. Los desarrolladores de IA requieren grandes cantidades de datos para capacitar a sus modelos, mientras que los editores ven que su contenido se utiliza para alimentar los servicios que canibalizan su tráfico e ingresos.
Esto ha llevado a una estrategia fracturada de”demandar algunos, firmar con otros”en la industria de los medios. Mientras que el New York Times demanda a Openai, simultáneamente firmó un importante acuerdo de licencia de contenido con Amazon.
La situación de la perplejidad encapsula esta lucha en toda la industria. Es simultáneamente un innovador famoso que empuja los límites de la búsqueda de IA y un actor controvertido acusado de romper protocolos web de larga data. El resultado de este y conflictos similares probablemente definirán las reglas para la próxima generación de Internet.
.