Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Исследование компании Barracuda выявило масштабы деятельности ботов-скреперов данных.
Не все боты вредны, но многие извлекают огромные объемы данных без разрешения. Эти «серые» боты могут быть очень агрессивными, предупреждает отчет.
Новое исследование Barracuda выявило «серые боты», наряду с «хорошими» и «плохими» ботами, которые просматривают веб-пространство и извлекают данные. В то время как «хорошие» боты, такие как боты для SEO и обслуживания клиентов, ищут информацию, «плохие» боты предназначены для вредоносных действий, таких как мошенничество, кража данных и взлом учетных записей.
Между ними есть «серые» боты, которые, по словам Barracuda, являются ботами-скреперами GenAI, разработанными для извлечения значительных объемов данных с веб-сайтов, предположительно для обучения моделей ИИ или сбора контента в Интернете, такого как новости, обзоры и предложения о путешествиях.
Эти боты «размывают границы законной деятельности», утверждается в отчете. Хотя они не являются явно вредоносными, их подход может быть «вопросительным», а некоторые даже «очень агрессивными».
Программное обеспечение для обнаружения Barracuda выявило миллионы запросов, полученных веб-приложениями от ботов GenAI с декабря 2024 года по февраль 2025 года. Одно из отслеживаемых веб-приложений получило 9,7 миллиона запросов от ботов-скреперов всего за 30 дней.
Эти боты собирают данные и могут удалять их без разрешения, а также могут перегружать веб-приложения трафиком, нарушать операции и извлекать защищенные авторским правом данные для обучения моделей ИИ, что может нарушать права владельца.
Многие выступили против таких практик, в частности, творческие индустрии в Великобритании запустили кампанию «Make it Fair», чтобы протестовать против использования их работ моделями ИИ для создания фотографий, видео, историй или другого контента без разрешения или указания авторства.
Риски для конфиденциальности данных также связаны с таким уровнем сбора данных, поскольку некоторые сайты содержат конфиденциальные данные клиентов, например, в сфере здравоохранения или финансовых услуг.
Боты также могут скрывать аналитику веб-сайтов, что затрудняет для организаций оценку и отслеживание подлинного трафика или поведения пользователей, что усложняет принятие бизнес-решений.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...