Загрузка предыдущей публикации...
Загрузка предыдущих новостей...
Когда тысячи страниц начали исчезать с сайта Центров по контролю и профилактике заболеваний (CDC) в конце минувшей недели, исследователи общественного здравоохранения быстро приступили к архивированию удаленных данных. Вскоре стало ясно, что Internet Archive (IA) предлагает один из самых эффективных способов сохранения онлайн-данных и отслеживания изменений на правительственных сайтах.
На протяжении многих лет IA собирала снимки публичного Интернета, что облегчает сравнение текущих версий сайтов с их историческими вариантами. Кроме того, IA позволяет пользователям загружать цифровые материалы для расширения веб-архива.
Обе эти функции архива сразу же показали свою полезность исследователям, оценивающим объем данных, который мог быть потерян из-за быстрой очистки после двух указов президента Трампа. Вирусолог Анджела Расмуссен стала частью небольшой группы исследователей, которые смогли скачать весь сайт CDC всего за несколько дней и создать общественный ресурс, объединяющий информацию с сайта CDC и удаленные данные.
Эти наборы данных, многие из которых долгое время были в общем доступе, были загружены на IA анонимным пользователем под ником "SheWhoExists" 31 января.
В будущем Расмуссен сообщила Ars Technica, что IA останется ключевым инструментом для исследователей, стремящихся внимательно следить за любыми неожиданными изменениями в доступе к публичным данным.
Загрузка предыдущей публикации...
Загрузка следующей публикации...
Загрузка предыдущих новостей...
Загрузка следующих новостей...