L’article publié par la société Cloudflare explique que les robots du service d’intelligence artificielle Perplexity utilisent des méthodes pour cacher qu’elle parcourent les sites web pour récupérer des informations. En changeant souvent leur « user agent » (l’identifiant qui indique normalement quel navigateur ou robot visite un site) et en utilisant différentes adresses IP et réseaux internet, Perplexity essaie d’éviter les blocages mis en place par les sites web qui ne veulent pas être visités par leurs robots.

Cette pratique soulève des préoccupations en matière de conformité et de respect des préférences de confidentialité des sites web. Les actions de Perplexity sont en conflit direct avec les directives de certains sites qui souhaitent restreindre ou empêcher ces techniques de “crawling” de leurs contenus.

L’article met en lumière une tactique utilisée pour masquer l’activité de crawling, ce qui peut avoir des implications sur la sécurité et la conformité des données en ligne.

En résumé, cet article sert à expliquer comment Perplexity s’y prend pour parcourir le web discrètement, en changeant régulièrement son identité et ses adresses internet, afin d’accéder à des sites qui souhaitent empêcher ce type de collecte par des robots. Cette situation pose problème pour les créateurs de sites web qui cherchent à protéger leurs contenus et leurs services contre les usages non autorisés.


🔗 Source originale : https://blog.cloudflare.com/perplexity-is-using-stealth-undeclared-crawlers-to-evade-website-no-crawl-directives/