Сервисы и трюки, с которыми найдётся ВСЁ.
Зачем это нужно: с утра мельком прочитали статью, решили вечером ознакомиться внимательнее, а ее на сайте нет? Несколько лет назад ходили на полезный сайт, сегодня вспомнили, а на этом же домене ничего не осталось? Это бывало с каждым из нас. Но есть выход.
Всё, что попадает в интернет, сохраняется там навсегда. Если какая-то информация размещена в интернете хотя бы пару дней, велика вероятность, что она перешла в собственность коллективного разума. И вы сможете до неё достучаться.
Поговорим о простых и общедоступных способах найти сайты и страницы, которые по каким-то причинам были удалены.
1. Кэш Google, который всё помнит
Google специально сохраняет тексты всех веб-страниц, чтобы люди могли их просмотреть в случае недоступности сайта. Для просмотра версии страницы из кэша Google надо в адресной строке набрать:
http://webcache.googleusercontent.com/search?q=cache:https://www.iphones.ru/
Где https://www.iphones.ru/ надо заменить на адрес искомого сайта.
2. Web-archive, в котором вся история интернета
Во Всемирном архиве интернета хранятся старые версии очень многих сайтов за разные даты (с начала 90-ых по настоящее время). На данный момент в России этот сайт заблокирован.
3. Кэш Яндекса, почему бы и нет
К сожалению, нет способа добрать до кэша Яндекса по прямой ссылке. Поэтому приходиться набирать адрес страницы в поисковой строке и из контекстного меню ссылки на результат выбирать пункт Сохраненная копия. Если результат поиска в кэше Google вас не устроил, то этот вариант обязательно стоит попробовать, так как версии страниц в кэше Яндекса могут отличаться.
4. Кэш Baidu, пробуем азиатское
Когда ищешь в кэше Google статьи удаленные с habrahabr.ru, то часто бывает, что в сохраненную копию попадает версия с надписью «Доступ к публикации закрыт». Ведь Google ходит на этот сайт очень часто! А китайский поисковик Baidu значительно реже (раз в несколько дней), и в его кэше может быть сохранена другая версия.
Иногда срабатывает, иногда нет. P.S.: ссылка на кэш находится сразу справа от основной ссылки.
5. CachedView.com, специализированный поисковик
На этом сервисе можно сразу искать страницы в кэше Google, Coral Cache и Всемирном архиве интернета. У него также еcть аналог cachedpages.com.
6. Archive.is, для собственного кэша
Если вам нужно сохранить какую-то веб-страницу, то это можно сделать на archive.is без регистрации и смс. Еще там есть глобальный поиск по всем версиям страниц, когда-либо сохраненных пользователями сервиса. Там есть даже несколько сохраненных копий iPhones.ru.
7. Кэши других поисковиков, мало ли
Если Google, Baidu и Yandeх не успели сохранить ничего толкового, но копия страницы очень нужна, то идем на seacrhenginelist.com, перебираем поисковики и надеемся на лучшее (чтобы какой-нибудь бот посетил сайт в нужное время).
8. Кэш браузера, когда ничего не помогает
Страницу целиком таким образом не посмотришь, но картинки и скрипты с некоторых сайтов определенное время хранятся на вашем компьютере. Их можно использовать для поиска информации. К примеру, по картинке из инструкции можно найти аналогичную на другом сайте. Кратко о подходе к просмотру файлов кэша в разных браузерах:
Safari
Ищем файлы в папке ~/Library/Caches/Safari.
Google Chrome
В адресной строке набираем chrome://cache
Opera
В адресной строке набираем opera://cache
Mozilla Firefox
Набираем в адресной строке about:cache и находим на ней путь к каталогу с файлами кеша.
9. Пробуем скачать файл страницы напрямую с сервера
Идем на whoishostingthis.com и узнаем адрес сервера, на котором располагается или располагался сайт:
После этого открываем терминал и с помощью команды curl пытаемся скачать нужную страницу:
Что делать, если вообще ничего не помогло
Если ни один из способов не дал результатов, а найти удаленную страницу вам позарез как надо, то остается только выйти на владельца сайта и вытрясти из него заветную инфу. Для начала можно пробить контакты, связанные с сайтом на emailhunter.com:
О других методах поиска читайте в статье 12 способов найти владельца сайта и узнать про него все.
А о сборе информации про людей читайте в статьях 9 сервисов для поиска информации в соцсетях и 15 фишек для сбора информации о человеке в интернете.
24 комментариев
Форум →8 и сразу 10 лол
@Kay_Leng, ???
@Ирина Чернова, ему привиделась после цифра 10
Говорил же, Ирина знает как найти
@mcorn, спасибо Вам за идею статьи:-)
@Ирина Чернова, своими статьями выделяется из кучи рекламного говна, которым последнее время айфонсру просто перенасыщен..
Спасибо, полезная инфа.
Пропущен еще один способ. Если знать хостинг сайта и на нем ничего не удаляли (даже если домен разделегирован), то через Терминал можно выкачать все файлы. Надо лишь ввести одну команду.
@Артур Малосиев, большое спасибо) Добавила в статью)
@Артур Малосиев, очень специфичный способ и практически всегда он не будет работать ибо есть такое понятие как virtualhost. Можно еще конечно с hosts поплясать, но тоже не всегда работает :)
@evil.box, ну как сказать. 5 лет назад я каждую ночь парсил непродленные домены и выкачивал сайты ТИЦ > 50, PR > 2. Это было чистой воды задротство, но если удавалось скачивать до утра 20-30 сайтов ЦЕЛИКОМ, а потом продать их на бирже, то в день я клал в карман 2000 руб. Неплохая прибавка, считаю. Сейчас это не работает из-за смены поисковых алгоритмов, которые убили данный бизнес целиком. Зато появились другие инструменты, не менее вкусные.
@Артур Малосиев,
ок, сэр,, не подскажете, как полностью скачать содержимое своего аккаунта с livejournal?
@troublegum, можно написать bash script, который будет поочередно скачивать страницы за разные даты пример: xxxx.livejournal.com/2015/01/01 потом xxxx.livejournal.com/2015/01/02 и т.д. А потом написать скрипт, который будет удалять файлы с пустыми днями (по словам no recent entries)
@troublegum, или попробовать правильно настроить httptrack (чтобы скачивались только страницы из конкретного журнала а не весь ЖЖ)
@Ирина Чернова, ну, на дворе праздники, позволи немного неформальности )
барышня, “айфонз.ру”, “ирина”, терминал и bash – загранью добра и зла.
пойду вспоминать команды, кроме sudo, лет десять в никуда не тыкал.
) да, а мужны эти пусть про как правильно сбросить лишний вес пишут. “айфонз” же.
)
У меня вебархив работает
@Seva2006, скорее всего скоро перестанет работать)
ирина, спасибо. (удивительно, что единственная барышня во всей редакции пишет отличные статьи на “пользовательские” темы, а мужики гонят “джинсу” и про уровень холестерина в фитнесс-трекерах.) спасибо вам.
по делу.
webarchive имеет очень странный алгоритм сохранения. детали не выяснял, но мой персональный бложик, который существовал на границе девяностых – начала двухтысячных, сохранился там чуть более, чем странно: какие-то заметки сохранились полностью, в каких-то нет иллюстраций, каких-то нет вообще.
просто, “хозяйке на заметку”, там не так всё просто.
кстати, за что его запретили в россии?
@troublegum, по моим наблюдениям: картинки до 25КБ до середины 2000-х годов не сохранялись вообще (чисто на глаз, со всей точностью утверждать не могу)
Роскомнадзор постоянно требует у сайтов удалять страницы с запрещенным содержимым. А в вебархиве все эти удаленные страницы есть.
Писать рекламные материалы и статьи про фитнесс гораздо более ответственная и сложная задача, чем писать IT-инструкции.
@Ирина Чернова, почаще пишите, пожалуйста.
Или скидывайте в лс все интересные ссылки))
@Dexfir, а на iPhones можно как-то отправлять что-то в лс?
@Dexfir, ага, сначала ссылки в ЛС, потом телефончик не дадите ;)
@Ирина Чернова,
– по первому пункту – ух! спасибо за наблюдение. это ж времена модемов были, иллюстрации оптимизировались максимально. спасибо за идею;
– примерно так и думал.
– ирина, эти, которые вам про “ответственность” на джинсе говорят, – клоуны.
поверьте мне, я в промо (на телеке, правда) много лет. ваши статьи – гораздо интереснее этой рекламной нахлобучке, которую ваши коллеги несут. правда.
упоминание утилит командной строки и, в частности, curl вызывает трепет сердца моего
Что значит «открываем терминал» в девятом пункте? Как это открывается?
Нашли орфографическую ошибку в новости?
Выделите ее мышью и нажмите Ctrl+Enter.Как на iPhone установить беззвучный рингтон
Почему старый iPhone начинает плохо работать
Куда надежнее отдать на ремонт iPhone и Mac?
Почему iPhone не может переподключиться к роутеру
Как на iPhone очистить историю браузера. Удаляем посещенные сайты в Safari быстро
Как изменить заставку на экране блокировки Mac
Почему iTunes на Windows-компьютере не видит iPhone
Легкий способ запретить iPhone выходить из приложения