消滅したサイト・見つからないページを見る方法
「ページが見つかりません。」
ブックマークしていた懐かしいサイトや昔のウエブサイトのリンクが消えているときのメッセージ。
使える情報があったホームページが見れなくなった。
そんな消えてしまったサイトや削除されたホームページを復活させる対処方法です。
おいおい。
消したんだから探すなよー。
見れなくしてくれよー。
という、黒歴史を消したいあなたにはメール1通でアーカイブから削除する手順書をご覧ください。
消えたページはWayback Machineで探す
アクセスするとエラーになったり、見つからないページやサイトはデータが消えているために見ることができません。それは、
データが無いだけ。
つまり、消えてしまったデータがどこかにあればサイト・ページが消滅していても見ることができます。データを保存している可能性があるのがWayback Machine。
世界中のWebサイトのデータを定期的に保存(キャッシュ)しているWayback Machineを使えば消えたページを見れる可能性があります。
Wayback Machineは世界中のウェブを保存している世界最大のアーカイブサイト。ここで見れなければ諦めムードになってきます。
消えたページを見る方法
消えたページを見る方法はカンタン。
テクニックというほどの技でじゃなくて、Wayback Machine で見たいURLを貼り付けると保存された過去データを閲覧できます。
デフォルトのカレンダーで見るとキャッシュされたデータが時系列順になっています。
例えば、当サイトは2019年に開設したので2019年からアーカイブされています。カレンダーに青く丸がついているところがWayback Machineが保存した日です。クリックすると保存されたサイトが表示されます。
Wayback Machineで見れないときの対処方法
URLの確認
Wayback Machineで開いても保存されていないときはエラーになります。エラーになったときは念のためURLを確認です。
「404 ページが見つかりません。」と表示されているページのURLではなく、
リンク文字を右クリックして「リンクのアドレスをコピー」してみましょう。
WordPressサイトだとページが無いときは、エラーページにリダイレクトされるので見たいページじゃなくてエラーページのURLをコピペしていないか確認です。
ページが判らないときの対処方法
サイトは分かるけどページがワカンナイ。
そんなときはサイト名だけをコピペしてみましょう。
Wayback Machineは、サイト構造をまるっと保存しているのでサイトのトップからリンクから辿れば探せる可能性があります。
表示されたキャッシュから大まかな日付を選んで探してみてください。
画像を探したい
Wayback Machineに画像が保存されていなくてもURLから画像のファイル名を調べることができます。
画像のファイル名をグーグルで検索すると他サイトが同じファイルで使っていた場合、もしかしたら見つかる可能性があります。検索結果を確認してみましょう。
もしくは、画像のサムネイルがある場合、画像検索で類似の写真から見つかることもあります。
画像が見つかって入手できたとしても著作権はグレーなので個人で楽みましょう。
Wayback Machineの限界
Wayback Machineがデータをスナップショットする頻度は数カ月に1度程度なので保存されていないページもあります。特に画像データは抜け落ちていることが多いです。
有限なリソースの中で世界中のサイトデータを何年もアーカイブしているので保存されていないデータがあってもは無理もありません。
サイトを保存するいく仕組みはサイト内のページ内のリンクがなくなるまで辿って行ってアーカイブします。そのためにクローラーが探せない孤立したページや動的なページは保存できません。
Wayback Machineにも限界があるのです。
その他のアーカイブサイト
Wayback Machineが知名度・アーカイブ量が抜き出ていますが国産アーカイブサービスもあります。
ウェブ魚拓
ウェブ魚拓は時事ニュースなどすぐに消えてしまうサイトのページをスクショできる国産のサービス。
ウェブ魚拓の仕様は自動収集を行いません。誰かが魚拓をとっている必要があります。
もともとは、メディアなどが都合の悪くなった記事を削除・改変されたときに改変前のデータを証拠としてデジタルコピーしておくサービス。
サイトを丸ごと保存よりも、炎上して削除されたページ記事が記録されていることが得意です。
国立国会図書館インターネット資料収集保存
国立国会図書館インターネット資料収集保存(Warp)は国立国会図書館が行っている国の機関や自治体をはじめとする公的機関のウェブサイトを網羅的に収集していている事業。
公的機関のサイトデータを見るときはWarpが頼りになります。
Warpが保存している機関
国交省サイトのリニューアルで消えてしまった「航空管制官のエアバンドを聴いてみよう」もしっかり保存されていました。
GeoLog Project
Yahooのサービス終了に伴って閉鎖したジオシティーズ。
SNSがなかった時代に頼りになったのが蓄積されたノウハウを公開してくれた数多くの個人サイト。
そんなジオシティーズのウェブサイトを消滅前に収集したアーカイブを個人で復活させているプロジェクトが GeoLog Project。
今では稀有な存在になった極上のマニア感のある情報のコレクションが復活しています。
※ 2022年12月末でサービス終了
対処法のまとめ
- 消えて見えなくなったページはWayback MachineにURLを打ち込む
- ページのURLがなかったらWayback Machineにサイト名を打ち込むんで辿る
- 画像はファイル名・画像検索でもググる。
- 炎上ネタのときはウェブ魚拓に可能性あり
- 公的機関のウェブサイトを見るときはWarpがイチオシ
- ジオシティーズの廃墟はGeoLog Projectにリハウスしてる(2022年12月末まで)
新しい情報に上書きされたサイトでなく、昔の情報が必要になったときはお試しください。