Amazon Web Services (AWS) ha lanzado recientemente una investigación sobre Perplexity AI, una startup que utiliza inteligencia artificial con fines de búsqueda. El problema principal en cuestión es si Perplexity AI está violando las reglas de AWS al raspar sitios web que explícitamente restringen tales acciones.
La investigación fue provocada por preocupaciones planteadas sobre la dependencia de contenido de sitios web que habían implementado el Protocolo de Exclusión de Robots para evitar el raspado. Según un portavoz de AWS, los clientes que utilizan los servicios de AWS deben seguir las pautas establecidas por el Protocolo de Exclusión de Robots. Aunque este protocolo no es legalmente vinculante, es ampliamente respetado en la industria como un medio para prevenir el raspado no autorizado de contenido web.
Forbes había alegado que la startup se había involucrado en el uso no autorizado de contenido, incluido el robo descarado de artículos. Investigaciones posteriores de WIRED descubrieron evidencia de abuso de raspado y plagio asociado con sistemas vinculados al asistente de chat de búsqueda con inteligencia artificial de Perplexity. Empresas como Condé Nast, la empresa matriz de WIRED, han tomado medidas para bloquear los rastreadores de Perplexity, sin embargo, la startup aún logró acceder a sus servidores utilizando direcciones IP no reveladas para actividades de raspado.
El uso de direcciones IP no reveladas y compañías terceras para el raspado de contenido web plantea preocupaciones significativas sobre la transparencia y el cumplimiento de normas establecidas. El descubrimiento de las prácticas de Perplexity AI de rastrear ampliamente sitios web de noticias, a pesar de su prohibición de que los bots accedan a su contenido, ha llamado la atención de importantes medios como The Guardian, Forbes y The New York Times.
La investigación sobre las prácticas de Perplexity AI pone en relieve las implicaciones éticas y legales del raspado web en la era digital. A medida que la tecnología continúa avanzando, es crucial que las empresas mantengan la integridad, la transparencia y el cumplimiento de los estándares establecidos para garantizar la confianza y el respeto tanto de los usuarios como de las partes interesadas. La conclusión de esta investigación probablemente tendrá consecuencias de gran alcance para el futuro de las tecnologías de búsqueda impulsadas por IA y el ecosistema digital en general.
Deja una respuesta