9 способов найти удаленный сайт или страницу

|
FavoriteLoading В закладки
9 способов найти удаленный сайт или страницу

Сервисы и трюки, с которыми найдётся ВСЁ.

Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.

Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.

Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.

1. Кэш Google, который всё помнит

Google специально сохраняет тексты всех веб-страниц, чтобы люди могли их просмотреть в случае недоступности сайта. Для просмотра версии страницы из кэша Google надо в адресной строке набрать:

http://webcache.googleusercontent.com/search?q=cache:http://www.iphones.ru/

Где http://www.iphones.ru/ надо заменить на адрес искомого сайта.

2. Web-archive, в котором вся история интернета

third_link_is_right

Во Всемирном архиве интернета хранятся старые версии очень многих сайтов за разные даты (с начала 90-ых по настоящее время). На данный момент в России этот сайт заблокирован.

3. Кэш Яндекса, почему бы и нет

yandex_cache

К сожалению, нет способа добрать до кэша Яндекса по прямой ссылке. Поэтому приходиться набирать адрес страницы в поисковой строке и из контекстного меню ссылки на результат выбирать пункт Сохраненная копия. Если результат поиска в кэше Google вас не устроил, то этот вариант обязательно стоит попробовать, так как версии страниц в кэше Яндекса могут отличаться.

4. Кэш Baidu, пробуем азиатское

baidu_cache

Когда ищешь в кэше Google статьи удаленные с habrahabr.ru, то часто бывает, что в сохраненную копию попадает версия с надписью «Доступ к публикации закрыт». Ведь Google ходит на этот сайт очень часто! А китайский поисковик Baidu значительно реже (раз в несколько дней), и в его кэше может быть сохранена другая версия.

Иногда срабатывает, иногда нет. P.S.: ссылка на кэш находится сразу справа от основной ссылки.

5. CachedView.com, специализированный поисковик

cached_view

На этом сервисе можно сразу искать страницы в кэше Google, Coral Cache и Всемирном архиве интернета. У него также еcть аналог cachedpages.com.

6. Archive.is, для собственного кэша

archive_is

Если вам нужно сохранить какую-то веб-страницу, то это можно сделать на archive.is без регистрации и смс. Еще там есть глобальный поиск по всем версиям страниц, когда-либо сохраненных пользователями сервиса. Там есть даже несколько сохраненных копий iPhones.ru.

7. Кэши других поисковиков, мало ли

Если Google, Baidu и Yandeх не успели сохранить ничего толкового, но копия страницы очень нужна, то идем на seacrhenginelist.com, перебираем поисковики и надеемся на лучшее (чтобы какой-нибудь бот посетил сайт в нужное время).

8. Кэш браузера, когда ничего не помогает

Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:

Safari

Ищем файлы в папке ~/Library/Caches/Safari.

Google Chrome

В адресной строке набираем chrome://cache

Opera

В адресной строке набираем opera://cache

Mozilla Firefox

Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.

9. Пробуем скачать файл страницы напрямую с сервера

Идем на whoishostingthis.com и узнаем адрес сервера, на котором располагается или располагался сайт:

whoishostthis

После этого открываем терминал и с помощью команды curl пытаемся скачать нужную страницу:

curl_example

Что делать, если вообще ничего не помогло

Если ни один из способов не дал результатов, а найти удаленную страницу вам позарез как надо, то остается только выйти на владельца сайта и вытрясти из него заветную инфу. Для начала можно пробить контакты, связанные с сайтом на emailhunter.com:
email_hunter

О других методах поиска читайте в статье 12 способов найти владельца сайта и узнать про него все.

А о сборе информации про людей читайте в статьях 9 сервисов для поиска информации в соцсетях и 15 фишек для сбора информации о человеке в интернете.

Свежие горячие яблоки: Facebook, ВКонтакте и Telegram


Хочешь получать от нас новости Apple? Да | Нет

undefined
iPhones.ru
Сервисы и трюки, с которыми найдётся ВСЁ. Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход. Всё, что попадает в интернет,...
Тестируем
noize_wave noize_wave
шумоподавление
Прокомментировать

🙈 Комментарии 24

  1. Kay_Leng30 апреля 2016
    0

    8 и сразу 10 лол

    Ирина Чернова avatar
    Ирина Чернова30 апреля 2016
    0

    @Kay_Leng, ???

    Dexfir avatar
    Dexfir1 мая 2016
    0

    @Ирина Чернова, ему привиделась после цифра 10

  2. mcorn avatar
    mcorn30 апреля 2016
    0

    Говорил же, Ирина знает как найти

    Ирина Чернова avatar
    Ирина Чернова30 апреля 2016
    0

    @mcorn, спасибо Вам за идею статьи:-)

  3. Mak_s avatar
    Mak_s30 апреля 2016
    2

    @Ирина Чернова, своими статьями выделяется из кучи рекламного говна, которым последнее время айфонсру просто перенасыщен..
    Спасибо, полезная инфа.

  4. Артур Малосиев avatar
    0

    Пропущен еще один способ. Если знать хостинг сайта и на нем ничего не удаляли (даже если домен разделегирован), то через Терминал можно выкачать все файлы. Надо лишь ввести одну команду.

    Ирина Чернова avatar
    0

    @Артур Малосиев, большое спасибо) Добавила в статью)

    evil.box avatar
    evil.box1 мая 2016
    0

    @Артур Малосиев, очень специфичный способ и практически всегда он не будет работать ибо есть такое понятие как virtualhost. Можно еще конечно с hosts поплясать, но тоже не всегда работает :)

    Артур Малосиев avatar
    0

    @evil.box, ну как сказать. 5 лет назад я каждую ночь парсил непродленные домены и выкачивал сайты ТИЦ > 50, PR > 2. Это было чистой воды задротство, но если удавалось скачивать до утра 20-30 сайтов ЦЕЛИКОМ, а потом продать их на бирже, то в день я клал в карман 2000 руб. Неплохая прибавка, считаю. Сейчас это не работает из-за смены поисковых алгоритмов, которые убили данный бизнес целиком. Зато появились другие инструменты, не менее вкусные.

    troublegum avatar
    troublegum1 мая 2016
    0

    @Артур Малосиев,
    ок, сэр,, не подскажете, как полностью скачать содержимое своего аккаунта с livejournal?

    Ирина Чернова avatar
    0

    @troublegum, можно написать bash script, который будет поочередно скачивать страницы за разные даты пример: xxxx.livejournal.com/2015/01/01 потом xxxx.livejournal.com/2015/01/02 и т.д. А потом написать скрипт, который будет удалять файлы с пустыми днями (по словам no recent entries)

    Ирина Чернова avatar
    0

    @troublegum, или попробовать правильно настроить httptrack (чтобы скачивались только страницы из конкретного журнала а не весь ЖЖ)

    troublegum avatar
    troublegum2 мая 2016
    0

    @Ирина Чернова, ну, на дворе праздники, позволи немного неформальности )

    барышня, “айфонз.ру”, “ирина”, терминал и bash – загранью добра и зла.

    пойду вспоминать команды, кроме sudo, лет десять в никуда не тыкал.

    ) да, а мужны эти пусть про как правильно сбросить лишний вес пишут. “айфонз” же.

    )

  5. Seva2006 avatar
    Seva20061 мая 2016
    0

    У меня вебархив работает

    Ирина Чернова avatar
    0

    @Seva2006, скорее всего скоро перестанет работать)

  6. troublegum avatar
    troublegum1 мая 2016
    0

    ирина, спасибо. (удивительно, что единственная барышня во всей редакции пишет отличные статьи на “пользовательские” темы, а мужики гонят “джинсу” и про уровень холестерина в фитнесс-трекерах.) спасибо вам.

    по делу.

    webarchive имеет очень странный алгоритм сохранения. детали не выяснял, но мой персональный бложик, который существовал на границе девяностых – начала двухтысячных, сохранился там чуть более, чем странно: какие-то заметки сохранились полностью, в каких-то нет иллюстраций, каких-то нет вообще.

    просто, “хозяйке на заметку”, там не так всё просто.

    кстати, за что его запретили в россии?

    Ирина Чернова avatar
    0

    @troublegum, по моим наблюдениям: картинки до 25КБ до середины 2000-х годов не сохранялись вообще (чисто на глаз, со всей точностью утверждать не могу)
    Роскомнадзор постоянно требует у сайтов удалять страницы с запрещенным содержимым. А в вебархиве все эти удаленные страницы есть.

    Писать рекламные материалы и статьи про фитнесс гораздо более ответственная и сложная задача, чем писать IT-инструкции.

    Dexfir avatar
    Dexfir1 мая 2016
    0

    @Ирина Чернова, почаще пишите, пожалуйста.
    Или скидывайте в лс все интересные ссылки))

    Ирина Чернова avatar
    0

    @Dexfir, а на iPhones можно как-то отправлять что-то в лс?

    Артур Малосиев avatar
    0

    @Dexfir, ага, сначала ссылки в ЛС, потом телефончик не дадите ;)

    troublegum avatar
    troublegum1 мая 2016
    0

    @Ирина Чернова,

    – по первому пункту – ух! спасибо за наблюдение. это ж времена модемов были, иллюстрации оптимизировались максимально. спасибо за идею;

    – примерно так и думал.

    – ирина, эти, которые вам про “ответственность” на джинсе говорят, – клоуны.

    поверьте мне, я в промо (на телеке, правда) много лет. ваши статьи – гораздо интереснее этой рекламной нахлобучке, которую ваши коллеги несут. правда.

  7. Orgasmatron avatar
    Orgasmatron1 мая 2016
    0

    упоминание утилит командной строки и, в частности, curl вызывает трепет сердца моего

  8. Erop avatar
    Erop30 апреля 2017
    0

    Что значит «открываем терминал» в девятом пункте? Как это открывается?

Вы должны авторизоваться или зарегистрироваться для комментирования.

Нашли орфографическую ошибку в новости?

Выделите ее мышью и нажмите Ctrl+Enter.

Как установить аватар в комментариях?

Ответ вот здесь