На главную->Содержание

Интернет-археология
или как добыть информацию с закрывшегося сайта
Интернет-археология


   К сожалению (или к счастью?) Интернет очень быстро изменяется – одни сайты закрываются, вместо них открываются другие... Для тех, кто интересуется старыми компьютерами, закрытие сайтов – всегда плохо. Ведь на этих сайтах могло быть описание старого устройства, драйверы для него или просто какая-нибудь полезная программа или информация.
   Но если вы перешли по ссылке и увидели «ошибку 404» или сообщение «Сайт не найден» – не отчаивайтесь. Есть несколько способов добраться до нужной вам информации.
   Если сайт закрылся недавно, и вам нужна только текстовая информация с него, можно воспользоваться кэшем различных поисковых систем. Чтобы получить доступ к кэшированной версии какой-либо web-страницы в Google просто введите в поисковом запросе «cache:URL». Где вместо URL – нужный вам адрес, например: «cache:nostalgy.net.ru/forum/». В Яндексе для этого введите в адресной строке браузера следующее:
http://hghltd.yandex.net/yandbtm?url=http://nostalgy.net.ru/forum/

   Нужный вам адрес вводится после url= (в данном случае - http://nostalgy.net.ru/forum/) не забывайте префикс «http://» и символ «/» в конце – без них не работает.
   Подобный кэш есть практически у всех поисковиков, но, скажем, в Рамблере его объём намного меньше. Рекордсмены по количеству кэшированных страниц – это Гугл и Яндекс.
   В принципе, всё это можно сделать проще – просто введите нужный вам URL в строку запроса поисковика. Среди ссылок скорее всего будет и та, что ведёт непосредственно на разыскиваемый вами сайт (даже если он закрылся). А под ссылкой – надпись «Сохраненная копия» (в Google) или просто «копия» (в Яндексе). Вот это и есть ссылка на кэшированную страницу. Вот только таким образом до некоторых сохранённых страниц не удаётся добраться... (В отличие от первого метода).
   Таким образом (через кэш поисковиков) мне, например, удалось частично восстановить один из форумов FDD5-25.NET, результат можете глянуть здесь. Таким же методом я восстановил форум сайта DG-Tech, уничтоженный СмартХакером (восстановленный архив форума лежит здесь).
   Если сайт закрылся давно, и вам нужен с него не только текст, но и, скажем, какие-нибудь файлы, то фокус с кэшем не поможет. В этом случае вам поможет сервис WebArchive (The Wayback Machine). Этот замечательный сервис с определённой периодичностью делает «снимки» всех сайтов Интернета. Работает он аж с 1996 года.
   Иногда бывает очень интересно посмотреть, как выглядели сайты в самом начале эпохи Интернета.
   Итак, заходите на сайт http://www.archive.org/web/web.php , вводите в соответствующее поле нужный вам адрес. Должна появиться примерно такая таблица:

WebArchive - таблица дат

   Вы видите список дат, когда были сделаны «снимки» сайта. Щёлкните по нужной вам дате – и вы увидите состояние сайта на тот момент. Довольно часто, правда, какие-то файлы в этом архиве не сохраняются. Если какой-то файл не качается – попробуйте другую дату.
   К сожалению, нормальной поисковой системы по этому архиву не существует – вам обязательно нужно знать адрес сайта. Но всё равно, я бы хотел от всей души поблагодарить создателей этого замечательного проекта!
   Есть и другие способы «добывания» информации с закрывшихся сайтов. Например, сайты часто не закрываются окончательно, а просто переезжают на новый адрес. В таком случае их можно найти, скажем, по каким-нибудь ключевым фразам. Например, после закрытия хостинга www.geocities.com, многие из сайтов сейчас доступны на новых адресах, начинающихся с www.reocities.com .
   Иногда для поиска информации вообще нужны своего рода детективные методы. Скажем, можно через какую-нибудь службу whois (что-то вроде whois.domaintools.com) поискать, на кого зарегистрировано доменное имя сайта. Там часто можно найти e-mail регистранта, связаться с ним, попросить нужную вам информацию и т.п. Или, например, если сам закрывшийся сайт был размещён на домене, скажем, четвертого уровня (что-то вроде sunhan.stu.neva.ru), можно попытаться зайти на сайт третьего уровня (www.stu.neva.ru), связаться с его администрацией и т.д. Примерно такими методами мне удалось добраться до файлов с Linux'ом для компьютера Беста-88.

   В заключении обращение к владельцам сайтов.

   Уважаемые администраторы и владельцы сайтов! Пожалуйста, если собираетесь закрыть сайт, предупредите всех на главной странице хотя бы за месяц до этого. И вообще, если есть возможность, не закрывайте сайт, а просто переведите его в режим «read-only». Или можете перед закрытием весь контент сайта собрать в один архив, и выложить его на любой файлообменник для общего доступа. Или, если сайт был на платном хостинге, и вам жалко на него денег – просто перенесите его на бесплатный хостинг.
   Я, например, особенно болезненно отношусь к закрытию разных форумов, где я принимал участие в обсуждениях. Ведь такой форум не просто собственность одного человека – его создавало множество разных людей, они что-то обсуждали, искали решения проблем, общались, а тут – бах, и нет ни сайта, ни форума... :-(
   Пожалуйста, не закрывайте свои сайты, а если уж закрыли – позаботьтесь, чтобы уникальный контент сайта не был потерян навсегда...
   И ещё одно – пожалуйста, регулярно делайте бэкапы своего сайта, особенно форумов.


uav1606

На главную->Содержание