マヨケーがポアされたため、現在はロシケーがメインとなっています。

「ウェブアーカイブ」の版間の差分

提供:唐澤貴洋Wiki
ナビゲーションに移動 検索に移動
>Ostrich
編集の要約なし
>植物製造器
(スタイル修正)
1行目: 1行目:
<!-- ページ名はウェブアーカイブとしましたが、魚拓にした方がいいのでしょうか? -->
'''ウェブアーカイブ'''または'''(ウェブ)魚拓'''(ぎょたく)とは、あるサイトを保存し、アーカイブとするサービスである。
'''ウェブアーカイブ'''または'''(ウェブ)魚拓'''(ぎょたく)とは、あるサイトを保存し、アーカイブとするサービスである。


当ページでは主に恒心教とウェブアーカイブの関連性及び使い方について記述する。
当ページでは主に恒心教とウェブアーカイブの関連性及び使い方について記述する。


== 概要 ==
== 概要 ==
Webサイトは[[UNDER CONSTRUCTION|製作者がボンクラ]]でない限りは随時[[恒心]]されており<ref>特にニュースサイトは恒心が早く、たとえば[https://www3.nhk.or.jp/news/ NHKのニュース]は1日程度でページが消去されてしまうことが殆どである。</ref>、[[事実追求路線|事実追求]]や特定の作業中に相手が気づいて情報を消すこともある。また[[カラッキング]]については、管理者が気付き次第復旧する場合が殆どである。このため、当Wikiや[[Wikipedia]]において、リンク先が消えたり編集されていることはよくあることである。しかしながら、かようなことが起きれば事実関係が有耶無耶になってしまい、[[包皮民]]などからねつ造などと吹聴される場合もある。
Webサイトは[[UNDER CONSTRUCTION|製作者がボンクラ]]でない限りは随時[[恒心]]されており<ref>特にニュースサイトは恒心が早く、たとえばNHKニュースは1日程度でページが消去されてしまうことが殆どである。</ref>、[[事実追求路線|事実追求]]や特定の作業中に相手が気づいて情報を消すこともある。また[[カラッキング]]については、管理者が気付き次第復旧する場合が殆どである。このため、[[唐澤貴洋Wiki|当Wiki]][[Wikipedia]]において、リンク先が消えたり編集されていることはよくあることである。しかしながら、かようなことが起きれば事実関係が有耶無耶になってしまい、ねつ造などと吹聴される場合もある。


特に[[Twitter]]においては、アカウント保持者が鍵をかけたり、アカウントそのものを削除する、あるいはTwitter社により凍結されることもありうる。そこで下記サイトに代表されるアーカイブサービスを利用することで、引用元が気付きあわてて削除なり編集なりをしても、当該項目の削除以前にアーカイブに登録しておけば引用元の真偽を証明でき、比較することで答え合わせもできる。
特に[[Twitter]]においては、アカウント保持者が鍵をかけたり、アカウントそのものを削除する、あるいはTwitter社により[[ポア|凍結]]されることもありうる。そこで下記サイトに代表されるアーカイブサービスを利用することで、引用元が気付きあわてて削除なり編集なりをしても、当該項目の削除以前にアーカイブに登録しておけば引用元の真偽を証明でき、比較することで答え合わせもできる。


その他にも、魚拓経由で閲覧すると相手に広告収入(いわゆるアフィリエイト)が入らないというメリットがある。アフィブログが炎上した際にもよく用いられる。
その他にも、魚拓経由で閲覧すると相手に広告収入(いわゆるアフィリエイト)が入らないというメリットがある。アフィブログが炎上した際にもよく用いられる。


== 主なウェブアーカイブサービス ==
== 主なウェブアーカイブサービス ==
魚拓は取得に失敗することがあったり、サービスごとの方針の違いによって削除されたりすることもある。また、[[サイモントン療法協会]]公式サイト<ref>archive.todayのIPをアク禁している。ウェブ魚拓やウェイバックマシン経由では保存できた。なお2018年3月現在解除されている模様。</ref>のように、特定の魚拓対策を行っているサイトも稀にある。
魚拓は取得に失敗することがあったり、サービスごとの方針の違いによって削除されたりすることもある。また、[[サイモントン療法協会]]公式サイト<ref>archive.todayのIPをアク禁していた。ウェブ魚拓やWayback Machine経由では保存できた。</ref>のように、特定の魚拓対策を行っているサイトもある。


サービス自体が終了する可能性もないわけではないので特に有力情報を発見した場合は複数のサービスで魚拓を残すことやローカル環境に保存しておくことを推奨する。
[[#Peeep.us|Peeep.us]]のようにサービス自体が終了する可能性もないわけではないので特に有力情報を発見した場合は複数のサービスで魚拓を残すことやローカル環境に保存しておくことを推奨する。


===[https://web.archive.org Wayback Machine]===
=== Wayback Machine ===
;概要
ウェブアーカイブサービスではおそらく最大手である。基本的に自動でクロールして保存するが、手動で登録することもできる。ただし、すべて英語である点に注意。読みたいページが削除されていた場合は、諦めずにここを当たると運良く保存されている場合がある。また読み込みの音楽ファイルも一緒にアーカイブされるため凝ったカラッキング<ref>[[カラッキング#ネルケプランニング公式サイト改竄事件|ネルケカラッキング]][https://web.archive.org/web/20170101042909/http://www.nelke.co.jp/index.php (魚拓)]や[[カラッキング#沖縄電力停電情報ページ改竄事件|沖縄電力カラッキング]][https://web.archive.org/web/20170313113414/https://www.okidenmail.jp/bosai/ (魚拓)]</ref>はこちらで魚拓を取った方が再現性が高い場合がある。
:ウェブアーカイブサービスではおそらく最大手である。基本的に自動でクロールして保存するが、手動で登録することもできる。ただし、すべて英語である点に注意。読みたいページが削除されていた場合は、諦めずにここを当たってみよう。運よく保存されている事がある。また読み込みの音楽ファイルも一緒にアーカイブされるため凝ったカラッキング<ref>[[カラッキング#ネルケプランニング公式サイト改竄事件|ネルケカラッキング]][https://web.archive.org/web/20170101042909/http://www.nelke.co.jp/index.php (魚拓)]や[[カラッキング#沖縄電力停電情報ページ改竄事件|沖縄電力カラッキング]][https://web.archive.org/web/20170313113414/https://www.okidenmail.jp/bosai/ (魚拓)]</ref>はこちらで魚拓を取った方が再現性が高い場合がある。
:archive.today<ref>[http://archivecaslytosk.onion archivecaslytosk.onion]では普通にWayback Machineの魚拓を取れる</ref>やウェブ魚拓からのアクセスを禁止している。


;使用方法
ウェブ魚拓からのアクセスを禁止している。
:魚拓登録は右下部の「Save Page Now」の下部のボックスに対象のURLを入力し「SAVE PAGE」を押す、もしくは「<nowiki>https://web.archive.org/save/対象URL</nowiki>」にアクセスする。
:魚拓の検索は{{gl|唐澤貴洋+site%3Aweb.archive.org|Google検索}}にはほとんど引っかからず、独自の[https://web.archive.org/web/*/唐澤貴洋 検索機能]も日本語検索の精度は非常に低い。そのため対象のurlを画面上部のボックスに入力して検索するしかない。一方、対象ページの下位ページを検索する機能は非常に優秀で「<nowiki>https://web.archive.org/web/*/対象URL/*</nowiki>」<ref>当wikiの[https://web.archive.org/web/*/https://sonshi.xyz/* 下位ページ検索](Wayback Machine)</ref>をアドレスバーに直接入力すると<!--もっと簡単にアクセスする方法を知っている方は追記お願いいたします-->アドレスや魚拓の取られた年月日等でソートできるばかりかキーワードで絞り込み検索までできる。ただし日本語表示や検索には対応していないため各自でUTF-8変換ツール等を使う必要がある。


===[https://archive.vn/ archive.today]===
==== 使用方法 ====
;概要
魚拓登録は右下部の「Save Page Now」の下部のボックスに対象のURLを入力し「SAVE PAGE」を押す、もしくは<code><nowiki>https://web.archive.org/save/対象URL</nowiki></code>にアクセスする。
:上のWayback Machineとは違い、完全手動登録制であるが、Wayback Machineより再現性が高く、日本語で表記に対応しているのも特徴。このサイトの強みは'''余程の事がない限り取得したページが削除されない'''事である。そのため恒心教徒に最も利用されていると言っても過言ではない。但し取得した際のIPアドレスは相手に伝わる<ref>魚拓を取った者の環境をなるべく再現しようとするために一瞬対象サイトにアクセスさせられる。[http://taruo.net/e/ 診断くん]などのIPが直接表示されたりGoogle検索などの位置情報を表示されるサイトは特に注意が必要。</ref>ため必要に応じて[[Tor]]<ref>現在Torによるアクセスは弾かれる。</ref>やプロキシを利用すること。
:ドメインはarchive.today<ref>現在はarchive.phにリダイレクトされる</ref>、archive.is、[https://archive.vn/ archive.li]、archive.fo<ref>現在はarchive.mdにリダイレクトされる。</ref>、'''[https://archive.vn/ archive.vn]'''、[https://archive.md/ archive.md]、[https://archive.vn/ archive.ph]と、いくつかあるがページ名は共通している。archive.isがアク禁にされた場合でもarchive.vn、archive.li、archive.phなら魚拓を取ることができる場合がある。また最近[http://archivecaslytosk.onion/ onion版]が出来、Torによる閲覧、魚拓登録が簡易化された。
:なお、スマホで魚拓を閲覧する際に何かしらのリンク(内部リンク含む)を踏むと、スパムサイト<ref>偽のウイルス警告、スマホに悪い影響を与えるファイルのダウンロードサイトなど</ref>に飛ばされる可能性が高いので要注意<ref>PCでの閲覧時でもこうなるかは不明。本来であればリンク先の魚拓がある場合はその魚拓に、なければ魚拓でない普通のサイトに飛ぶ。</ref>


;使用方法
魚拓の検索は{{gl|唐澤貴洋+site%3Aweb.archive.org|Google検索}}にはほとんど引っかからず、独自の検索機能<ref>[https://web.archive.org/web/*/唐澤貴洋 「唐澤貴洋」の検索結果]</ref>も日本語検索の精度は非常に低い。そのため対象のurlを画面上部のボックスに入力して検索するしかない。一方、対象ページの下位ページを検索する機能は非常に優秀で<code><nowiki>https://web.archive.org/web/*/対象URL/*</nowiki></code><ref>当Wikiの[https://web.archive.org/web/*/https://sonshi.xyz/* 下位ページ検索]</ref>をアドレスバーに直接入力するとアドレスや魚拓の取られた年月日等でソートできるばかりかキーワードで絞り込み検索までできる。ただし日本語表示や検索には対応していないため各自でUTF-8変換ツール等を使う必要がある。
:魚拓登録は赤背景のボックスにURLを入力し「ページを保存」(又は「save the page」)を押す。同URLの魚拓が撮られていた場合「This page was last archived ~~~ ago」というダイアログが表示されるが「save the page」を押せば登録出来る。ダイアログが表示されない場合はブラウザや回線を変更したりキャッシュを削除したりすることで再度取得することができる。
:魚拓のワード検索はトップページ下部の黒背景のボックスに入力すると利用でき、Googleエンジンを使用しているため抜けがあるもののWayback Machineと比べてはるかに良く引っかかる。またURLを入力するとそのページを検索することができ、URLの末尾に*をつけると下位ページを一覧で表示させることもできる<ref>当Wikiの[https://archive.vn/https://sonshi.xyz/* 下位ページ検索](archive.today)</ref>。その消されにくいという性質と魚拓のURLだけでなく魚拓元のURLでも検索に引っかかる<ref>始めはリンクされないがしばらくするとリンクされるようになる?詳細不明</ref>ため魚拓の魚拓という形で使用されることがある。


===[https://megalodon.jp ウェブ魚拓]===
=== archive.today ===
;概要
Wayback Machineとは違い、完全手動登録制であるが、Wayback Machineより再現性が高く、日本語で表記に対応しているのも特徴。このサイトの強みは'''余程の事がない限り取得したページが削除されない'''事である。そのため恒心教徒に最も利用されていると言っても過言ではない。但し取得した際のIPアドレスは相手に伝わる<ref>魚拓を取った者の環境をなるべく再現しようとするために一瞬対象サイトにアクセスさせられる。IPが直接表示されたりGoogle検索などの位置情報を表示するサイトは特に注意が必要。</ref>ため必要に応じて[[Tor]]やProxyを利用すること。
:Flashも保存されるが上記2つと違い日本の会社が行っているサービスのため、削除要請や開示請求にあっさりと応じる。恒心教徒にはほとんど利用されていない。自分用に取っておけるサービスもあるが有料。恒心以外の日本人利用者は多いためニュースの魚拓等を探す際は有用。<!-- 最近では[[Twitter]]の魚拓をモバイル版にせずに取りたい場合に使える模様<ref>[https://archive.vn/7C1co 7月28日]から[https://archive.vn/ShyRG 8月3日]の間にarchive.todayはTwitterの魚拓をモバイル版にして取る仕様に変更しているが、モバイル版ではツイート内の画像(最大4枚)を1枚しか保存できないという欠点がある。</ref>。 -->


;使用方法
ドメインは.today<ref>現在は.phにリダイレクトされる。</ref>、.is、.fo、'''.vn'''、.md、.phと、いくつかあるがページ名は共通している。
:魚拓登録は「魚拓をURLで検索・取得」の下のボックスにURLを入力「検索と確認」を押すと確認ページに飛ばされる。確認ページ中部の「このまま魚拓を取る」の下の「取得」ボタンを押す。
:魚拓のワード検索は「魚拓をフリーワードで検索」下のボックスに入力すればarchive.today同様Googleエンジンを使用した検索が行われ日本語検索も優秀、ただし魚拓が一度も外部に貼られていないとgooglebotに認識されないため抜けは多い。またURL検索は下位ページ検索が実装されていないため、一つ一つ手打ちで確認するか[https://megalodon.jp/pc/history 過去の魚拓一覧]から探し出すしかない<ref>一日分が約60~200ページほどに分割されているため、手作業での検索はほぼ不可能である。</ref>。そのため一度紛れてしまった魚拓を探し出すのは困難であるために意外と魚拓の魚拓を取ると権利者等に削除される可能性は低い。


===[https://www.webcitation.org/archive WebCite]===
archive.isがアク禁にされた場合でも.vn、.li、.phなら魚拓を取ることができる場合がある。また最近.onion<ref><nowiki>archivecaslytosk.onion</nowiki></ref><ref><nowiki>archiveiya74codqgiixo33q62qlrqtkgmcitqx5u2oeqnmn5bpcbiyd.onion</nowiki></ref>が出来、Torによる閲覧、魚拓登録が簡易化された。
;概要
:ここで紹介する中で最も使用されていないサイト。防弾状況等も不明。ただしその無名さからアクセス拒否しているサイトは限りなく少ない。ウェイバックマシンの魚拓を取れる数少ないサイトの一つであるという以外で利用価値は低い。現在魚拓の収集は行なっていない模様<ref>サイトの上部にWe are currently not accepting archiving requests.(現在アーカイブリクエストは受け付けていない)と書かれている</ref>


;使用方法
なお、スマホで魚拓を閲覧する際に何かしらのリンク(内部リンク含む)を踏むと、スパムサイトに飛ばされる可能性が高いので要注意<ref>PCでの閲覧時でもこうなるかは不明。本来であればリンク先の魚拓がある場合はその魚拓に、なければ魚拓でない普通のサイトに飛ぶ。</ref>
:「URL to Archive [url]:」の右のボックスに対象のURLを入力し、すぐ下のボックスにメールアドレスを入力する<ref>全く架空の物(karasawa@takahiro.comなど)でも通る</ref>。その他の項目は無視して「Submit」と書かれたボタンを押す。
:ワード検索は{{gl|唐澤貴洋+site%3Awebcitation.org|Googleのサイト指定検索}}しかなく、URL検索は下位ページ検索が実装されておらずウェブ魚拓と使用感は似ている。


===GoogleやYahoo!のキャッシュ===
==== 使用方法 ====
;概要
魚拓登録は赤背景のボックスにURLを入力し「ページを保存」(又は「save the page」)を押す、もしくは<code><nowiki>https://archive.vn/?run=1&url=対象URL</nowiki></code>にアクセスする。同URLの魚拓が撮られていた場合「This page was last archived ~~~ ago」というダイアログが表示されるが6分以上経過しているとき「save the page」を押せば登録出来る。ダイアログが表示されない場合はブラウザや回線を変更したりキャッシュを削除したりすることで再度取得することができる。
:上記の魚拓サイトとは全く性質が異なり手動登録は(原則)出来ず、勝手に取得される。取得頻度や取得率がウェイバックマシンと比べて高いことが特徴。だが他サービスによって魚拓を取らないと数日で消えてしまう。


;使用方法
魚拓のワード検索はトップページ下部の黒背景のボックスに入力すると利用でき、Googleエンジンを使用しているため抜けがあるもののWayback Machineと比べてはるかに良く引っかかる。またURLを入力するとそのページを検索することができ、URLの末尾に*をつけると下位ページを一覧で表示させることもできる<ref>当Wikiの[https://archive.vn/https://sonshi.xyz/* 下位ページ検索]</ref>。その消されにくいという性質と魚拓のURLだけでなく魚拓元のURLでも検索に引っかかる<ref>始めはリンクされないがしばらくするとリンクされるようになる?詳細不明</ref>ため魚拓の魚拓という形で使用されることがある。
:GoogleやYahoo!でワード検索すると、URLの横に「キャッシュ」もしくは「▼」をクリックする事で見ることができる。またGoogleであれば「cache:対象URL」で検索すれば最新のバージョンのキャッシュが表示される<ref>当wikiの{{gl|cache%3Ahttps://sonshi.xyz/|Googleキャッシュ}}</ref>


===スクリーンショット===
=== ウェブ魚拓 ===
;概要
Flashも保存されるが上記2つと違い日本の会社が行っているサービスのため、削除要請や開示請求にあっさりと応じる。恒心教徒にはほとんど利用されていない。自分用に取っておけるサービスもあるが有料。恒心以外の日本人利用者は多いためニュースの魚拓等を探す際は有用。
:各種魚拓とは違い捏造が可能な点から証拠能力が落ちるが、画像化することで保存が容易になり、魚拓以上に様々なサイトに拡散できるため削除しきることは不可能となる。また、アクセスを拒否することが不可能な点で魚拓に勝る。
:捏造が疑われない方法として、ネット上でスクリーンショットを取得できるサービス<ref>数多くあるが[http://kwout.com これ]など高画質で1枚で出力される。当ページwikiの[http://kwout.com/grab?address=https%3A%2F%2Fsonshi.xyz%2F スクリーンショット]の[https://archive.vn/bUWtK 魚拓]</ref>でスクリーンショットを撮影し出力されたURLを上記サイトで魚拓を取得するという方法がある。


===[http://peeep.us Peeep.us]===
==== 使用方法 ====
2018年9月頃にサービスを終了した模様<ref>https://web.archive.org/web/20180902075206/http://peeep.us/</ref>。
魚拓登録は「魚拓をURLで検索・取得」の下のボックスにURLを入力「検索と確認」を押すと確認ページに飛ばされる。確認ページ中部の「このまま魚拓を取る」の下の「取得」ボタンを押す。


;概要
魚拓のワード検索は「魚拓をフリーワードで検索」下のボックスに入力すればarchive.today同様Googleエンジンを使用した検索が行われ日本語検索も優秀、ただし魚拓が一度も外部に貼られていないとgooglebotに認識されないため抜けは多い。またURL検索は下位ページ検索が実装されていないため、一つ一つ手打ちで確認するか過去の魚拓一覧<ref>[https://megalodon.jp/pc/history 過去の魚拓]</ref>から探し出すしかない<ref>一日分が約60~200ページほどに分割されているため、手作業での検索はほぼ不可能である。</ref>。そのため一度紛れてしまった魚拓を探し出すのは困難であるために意外と魚拓の魚拓を取ると権利者等に削除される可能性は低い。
:画像やCSS、JS等の読み込みファイルは保存されないがHTMLだけは保存される。自分だけが見れるサービスもある。ただし、Googleアカウントでログインする必要がある。一部ブラウザでは不正なサービスであると警告が出る模様。


;使用方法
=== WebCite ===
:魚拓取得はページ中部の緑枠に囲まれたボックスにURLを入力し右の「submit」を押す。するとGoogleアカウントを入力するように誘導される。
ここで紹介する中で最も使用されていないサイト。防弾状況等も不明。ただしその無名さからアクセス拒否しているサイトは限りなく少ない。ウェイバックマシンの魚拓を取れる数少ないサイトの一つであるという以外で利用価値は低い。現在魚拓の収集は行なっていない模様<ref>サイトの上部にWe are currently not accepting archiving requests.(現在アーカイブリクエストは受け付けていない)と書かれている</ref>。
:魚拓検索機能は全く無いので{{gl|唐澤貴洋+site%3Apeeep.us|Googleのサイト指定検索}}を使うことになる。


== 関連項目 ==
==== 使用方法 ====
* [[事実追求路線]]
「URL to Archive [url]:」の右のボックスに対象のURLを入力し、すぐ下のボックスにメールアドレスを入力する<ref>全く架空の物(karasawa@takahiro.comなど)でも通る</ref>。その他の項目は無視して「Submit」と書かれたボタンを押す。
* [[テンプレート:Archive]]
 
ワード検索は{{gl|唐澤貴洋+site%3Awebcitation.org|Googleのサイト指定検索}}しかなく、URL検索は下位ページ検索が実装されておらずウェブ魚拓と使用感は似ている。
 
=== GoogleやYahoo!のキャッシュ ===
上記の魚拓サイトとは全く性質が異なり手動登録は(原則)出来ず、勝手に取得される。取得頻度や取得率がウェイバックマシンと比べて高いことが特徴。だが他サービスによって魚拓を取らないと数日で消えてしまう。
 
==== 使用方法 ====
GoogleやYahoo!でワード検索すると、URLの横に「キャッシュ」もしくは「▼」をクリックする事で見ることができる。またGoogleであれば<code><nowiki>cache:対象URL</nowiki></code>で検索すれば最新のバージョンのキャッシュが表示される<ref>当wikiの{{gl|cache%3Ahttps://sonshi.xyz/|Googleキャッシュ}}</ref>。
 
=== スクリーンショット===
各種魚拓とは違い捏造が可能な点から証拠能力が落ちるが、画像化することで保存が容易になり、魚拓以上に様々なサイトに拡散できるため削除しきることは不可能となる。また、アクセスを拒否することが不可能な点で魚拓に勝る。
 
==== 使用方法 ====
捏造が疑われない方法として、ネット上でスクリーンショットを取得できるサービス<ref>数多くあるが[http://kwout.com これ]{{リンク切れ}}など高画質で1枚で出力される。当Wikiの{{archive|1=http://kwout.com/grab?address=https://sonshi.xyz/|2=https://archive.vn/bUWtK|3=スクリーンショット|nolink=1}}</ref>でスクリーンショットを撮影し出力されたURLを上記サイトで魚拓を取得するというものがある。
 
=== Peeep.us ===
2018年9月頃にサービスを終了した模様<ref>{{archive|http://peeep.us/|https://archive.vn/OdTjl|Error 404 (Page not found)!!1|nolink=1}}</ref>。
 
画像やCSS、JS等の読み込みファイルは保存されないがHTMLだけは保存される。自分だけが見れるサービスもある。ただし、Googleアカウントでログインする必要がある。一部ブラウザでは不正なサービスであると警告が出る模様。
 
==== 使用方法 ====
魚拓取得はページ中部の緑枠に囲まれたボックスにURLを入力し右の「submit」を押す。するとGoogleアカウントを入力するように誘導される。
 
魚拓検索機能は全く無いので{{gl|唐澤貴洋+site%3Apeeep.us|Googleのサイト指定検索}}を使うことになる。


== 外部リンク ==
== 外部リンク ==
*{{wpl|ウェブアーカイブ}} - [[Wikipedia]]
*{{wpl|ウェブアーカイブ}} - [[Wikipedia]]
**{{wpl|インターネットアーカイブ}}
**{{wpl|インターネットアーカイブ}}
***{{wpl|ウェイバックマシン}}
***[https://web.archive.org/ Wayback Machine]
**{{wpl|archive.is}}
**[https://archive.vn/ archive.today]
**{{wpl|ウェブ魚拓}}
***[https://archive.vn/ archive.fo]
***[https://archive.ph/ archive.ph]
***[https://archive.md/ archive.md]
***[https://archive.li/ archive.li]
**[https://megalodon.jp/ ウェブ魚拓]
***[http://gyo.tc ウェブ魚拓] - 短縮URL
**[https://www.webcitation.org/archive WebCite]
**[http://www.peeep.us/ Peeep.us]{{リンク切れ}}


== 出典・註釈 ==
== 出典・註釈 ==
<references />
<references />
== 関連項目 ==
*[[事実追求路線]]
*[[テンプレート:Archive]]


{{デフォルトソート:うえふああかいふ}}
{{デフォルトソート:うえふああかいふ}}
[[カテゴリ:外部サイト]]
[[カテゴリ:外部サイト]]
{{広告}}
{{広告}}

2020年3月6日 (金) 17:53時点における版

ウェブアーカイブまたは(ウェブ)魚拓(ぎょたく)とは、あるサイトを保存し、アーカイブとするサービスである。

当ページでは主に恒心教とウェブアーカイブの関連性及び使い方について記述する。

概要

Webサイトは製作者がボンクラでない限りは随時恒心されており[1]事実追求や特定の作業中に相手が気づいて情報を消すこともある。またカラッキングについては、管理者が気付き次第復旧する場合が殆どである。このため、当WikiWikipediaにおいて、リンク先が消えたり編集されていることはよくあることである。しかしながら、かようなことが起きれば事実関係が有耶無耶になってしまい、ねつ造などと吹聴される場合もある。

特にTwitterにおいては、アカウント保持者が鍵をかけたり、アカウントそのものを削除する、あるいはTwitter社により凍結されることもありうる。そこで下記サイトに代表されるアーカイブサービスを利用することで、引用元が気付きあわてて削除なり編集なりをしても、当該項目の削除以前にアーカイブに登録しておけば引用元の真偽を証明でき、比較することで答え合わせもできる。

その他にも、魚拓経由で閲覧すると相手に広告収入(いわゆるアフィリエイト)が入らないというメリットがある。アフィブログが炎上した際にもよく用いられる。

主なウェブアーカイブサービス

魚拓は取得に失敗することがあったり、サービスごとの方針の違いによって削除されたりすることもある。また、サイモントン療法協会公式サイト[2]のように、特定の魚拓対策を行っているサイトもある。

Peeep.usのようにサービス自体が終了する可能性もないわけではないので特に有力情報を発見した場合は複数のサービスで魚拓を残すことやローカル環境に保存しておくことを推奨する。

Wayback Machine

ウェブアーカイブサービスではおそらく最大手である。基本的に自動でクロールして保存するが、手動で登録することもできる。ただし、すべて英語である点に注意。読みたいページが削除されていた場合は、諦めずにここを当たると運良く保存されている場合がある。また読み込みの音楽ファイルも一緒にアーカイブされるため凝ったカラッキング[3]はこちらで魚拓を取った方が再現性が高い場合がある。

ウェブ魚拓からのアクセスを禁止している。

使用方法

魚拓登録は右下部の「Save Page Now」の下部のボックスに対象のURLを入力し「SAVE PAGE」を押す、もしくはhttps://web.archive.org/save/対象URLにアクセスする。

魚拓の検索はGoogle検索にはほとんど引っかからず、独自の検索機能[4]も日本語検索の精度は非常に低い。そのため対象のurlを画面上部のボックスに入力して検索するしかない。一方、対象ページの下位ページを検索する機能は非常に優秀でhttps://web.archive.org/web/*/対象URL/*[5]をアドレスバーに直接入力するとアドレスや魚拓の取られた年月日等でソートできるばかりかキーワードで絞り込み検索までできる。ただし日本語表示や検索には対応していないため各自でUTF-8変換ツール等を使う必要がある。

archive.today

Wayback Machineとは違い、完全手動登録制であるが、Wayback Machineより再現性が高く、日本語で表記に対応しているのも特徴。このサイトの強みは余程の事がない限り取得したページが削除されない事である。そのため恒心教徒に最も利用されていると言っても過言ではない。但し取得した際のIPアドレスは相手に伝わる[6]ため必要に応じてTorやProxyを利用すること。

ドメインは.today[7]、.is、.fo、.vn、.md、.phと、いくつかあるがページ名は共通している。

archive.isがアク禁にされた場合でも.vn、.li、.phなら魚拓を取ることができる場合がある。また最近.onion[8][9]が出来、Torによる閲覧、魚拓登録が簡易化された。

なお、スマホで魚拓を閲覧する際に何かしらのリンク(内部リンク含む)を踏むと、スパムサイトに飛ばされる可能性が高いので要注意[10]

使用方法

魚拓登録は赤背景のボックスにURLを入力し「ページを保存」(又は「save the page」)を押す、もしくはhttps://archive.vn/?run=1&url=対象URLにアクセスする。同URLの魚拓が撮られていた場合「This page was last archived ~~~ ago」というダイアログが表示されるが6分以上経過しているとき「save the page」を押せば登録出来る。ダイアログが表示されない場合はブラウザや回線を変更したりキャッシュを削除したりすることで再度取得することができる。

魚拓のワード検索はトップページ下部の黒背景のボックスに入力すると利用でき、Googleエンジンを使用しているため抜けがあるもののWayback Machineと比べてはるかに良く引っかかる。またURLを入力するとそのページを検索することができ、URLの末尾に*をつけると下位ページを一覧で表示させることもできる[11]。その消されにくいという性質と魚拓のURLだけでなく魚拓元のURLでも検索に引っかかる[12]ため魚拓の魚拓という形で使用されることがある。

ウェブ魚拓

Flashも保存されるが上記2つと違い日本の会社が行っているサービスのため、削除要請や開示請求にあっさりと応じる。恒心教徒にはほとんど利用されていない。自分用に取っておけるサービスもあるが有料。恒心以外の日本人利用者は多いためニュースの魚拓等を探す際は有用。

使用方法

魚拓登録は「魚拓をURLで検索・取得」の下のボックスにURLを入力「検索と確認」を押すと確認ページに飛ばされる。確認ページ中部の「このまま魚拓を取る」の下の「取得」ボタンを押す。

魚拓のワード検索は「魚拓をフリーワードで検索」下のボックスに入力すればarchive.today同様Googleエンジンを使用した検索が行われ日本語検索も優秀、ただし魚拓が一度も外部に貼られていないとgooglebotに認識されないため抜けは多い。またURL検索は下位ページ検索が実装されていないため、一つ一つ手打ちで確認するか過去の魚拓一覧[13]から探し出すしかない[14]。そのため一度紛れてしまった魚拓を探し出すのは困難であるために意外と魚拓の魚拓を取ると権利者等に削除される可能性は低い。

WebCite

ここで紹介する中で最も使用されていないサイト。防弾状況等も不明。ただしその無名さからアクセス拒否しているサイトは限りなく少ない。ウェイバックマシンの魚拓を取れる数少ないサイトの一つであるという以外で利用価値は低い。現在魚拓の収集は行なっていない模様[15]

使用方法

「URL to Archive [url]:」の右のボックスに対象のURLを入力し、すぐ下のボックスにメールアドレスを入力する[16]。その他の項目は無視して「Submit」と書かれたボタンを押す。

ワード検索はGoogleのサイト指定検索しかなく、URL検索は下位ページ検索が実装されておらずウェブ魚拓と使用感は似ている。

GoogleやYahoo!のキャッシュ

上記の魚拓サイトとは全く性質が異なり手動登録は(原則)出来ず、勝手に取得される。取得頻度や取得率がウェイバックマシンと比べて高いことが特徴。だが他サービスによって魚拓を取らないと数日で消えてしまう。

使用方法

GoogleやYahoo!でワード検索すると、URLの横に「キャッシュ」もしくは「▼」をクリックする事で見ることができる。またGoogleであればcache:対象URLで検索すれば最新のバージョンのキャッシュが表示される[17]

スクリーンショット

各種魚拓とは違い捏造が可能な点から証拠能力が落ちるが、画像化することで保存が容易になり、魚拓以上に様々なサイトに拡散できるため削除しきることは不可能となる。また、アクセスを拒否することが不可能な点で魚拓に勝る。

使用方法

捏造が疑われない方法として、ネット上でスクリーンショットを取得できるサービス[18]でスクリーンショットを撮影し出力されたURLを上記サイトで魚拓を取得するというものがある。

Peeep.us

2018年9月頃にサービスを終了した模様[19]

画像やCSS、JS等の読み込みファイルは保存されないがHTMLだけは保存される。自分だけが見れるサービスもある。ただし、Googleアカウントでログインする必要がある。一部ブラウザでは不正なサービスであると警告が出る模様。

使用方法

魚拓取得はページ中部の緑枠に囲まれたボックスにURLを入力し右の「submit」を押す。するとGoogleアカウントを入力するように誘導される。

魚拓検索機能は全く無いのでGoogleのサイト指定検索を使うことになる。

外部リンク

出典・註釈

  1. 特にニュースサイトは恒心が早く、たとえばNHKニュースは1日程度でページが消去されてしまうことが殆どである。
  2. archive.todayのIPをアク禁していた。ウェブ魚拓やWayback Machine経由では保存できた。
  3. ネルケカラッキング(魚拓)沖縄電力カラッキング(魚拓)
  4. 「唐澤貴洋」の検索結果
  5. 当Wikiの下位ページ検索
  6. 魚拓を取った者の環境をなるべく再現しようとするために一瞬対象サイトにアクセスさせられる。IPが直接表示されたりGoogle検索などの位置情報を表示するサイトは特に注意が必要。
  7. 現在は.phにリダイレクトされる。
  8. archivecaslytosk.onion
  9. archiveiya74codqgiixo33q62qlrqtkgmcitqx5u2oeqnmn5bpcbiyd.onion
  10. PCでの閲覧時でもこうなるかは不明。本来であればリンク先の魚拓がある場合はその魚拓に、なければ魚拓でない普通のサイトに飛ぶ。
  11. 当Wikiの下位ページ検索
  12. 始めはリンクされないがしばらくするとリンクされるようになる?詳細不明
  13. 過去の魚拓
  14. 一日分が約60~200ページほどに分割されているため、手作業での検索はほぼ不可能である。
  15. サイトの上部にWe are currently not accepting archiving requests.(現在アーカイブリクエストは受け付けていない)と書かれている
  16. 全く架空の物(karasawa@takahiro.comなど)でも通る
  17. 当wikiのGoogleキャッシュ
  18. 数多くあるがこれ[リンク切れ]など高画質で1枚で出力される。当Wikiのスクリーンショット( ​kwout.com/grab?address=https://sonshi.xyz/​ の魚拓)
  19. Error 404 (Page not found)!!1( ​peeep.us/​ の魚拓)

関連項目