Пятница, 22 августа в 02:47 UTC+3
Загрузка...

Perplexity использует скрытых, незаявленных краулеров для обхода директив запрета сканирования, утверждает Cloudflare.


56Опубликовано 04.08.2025 в 21:54Категория: БезопасностьИсточник
Изображение статьи

Стартап в области искусственного интеллекта Perplexity использует незадекларированных веб-краулеров, маскирующихся под обычные браузеры Chrome, для доступа к контенту веб-сайтов, которые явно заблокировали его официальных ботов, согласно отчету Cloudflare, опубликованному в понедельник. Когда задекларированные краулеры Perplexity сталкиваются с ограничениями в файле robots.txt или сетевыми блокировками, компания переключается на универсальный user agent, имитирующий "Chrome/124.0.0.0 Safari/537.36", работающий на macOS, сообщает компания, занимающаяся веб-инфраструктурой.

Инженеры Cloudflare протестировали такое поведение, создав новые домены с файлами robots.txt, запрещающими любой автоматизированный доступ. Несмотря на эти ограничения, Perplexity предоставлял подробную информацию о защищенном контенте по запросу, в то время как скрытый краулер генерировал от 3 до 6 миллионов запросов в день на десятки тысяч доменов. Незадекларированный краулер использовал несколько IP-адресов и сетевых провайдеров, чтобы избежать обнаружения.

Загрузка предыдущей публикации...

Загрузка следующей публикации...

Предыдущие новости в категории

Загрузка предыдущих новостей...

Следующие новости в категории

Загрузка следующих новостей...

Мы отбираем новости из проверенных источников, обрабатываем их с помощью современных AI-технологий и публикуем на сайте, созданном с использованием искусственного интеллекта. Все материалы принадлежат их авторам, а контент проходит дополнительную проверку на достоверность. Возможны ошибки в тексте, так как нейросеть тоже имеет свойство ошибаться. Все изображения являются фантазией нейросети, совпадение с реальными предметами и личностями маловероятно.

© 2025 NOTid . QAter . AI service.