世界を動かす技術を、日本語で。

10兆のウェブページがアーカイブされました

概要

  • Internet Archive がWayback Machineで 1兆ページ保存 の大記録を達成予定
  • 2025年10月、世界各地とオンラインで 記念イベント を開催
  • ウェブ保存の意義 や未来、影響事例を紹介
  • 著名人や専門家 によるトークやライブ音楽など多彩なプログラム
  • 一般参加・寄付・体験共有 も呼びかけ

Internet Archive 1兆ウェブページ保存記念イベント概要

  • Internet Archive はWayback Machineを通じて 1兆ページ のウェブアーカイブを実現
  • 1996年から世界中の図書館やパートナーと協力し、 人類のオンライン履歴 保存を推進
  • 大規模サイトから個人ページまで多様なウェブ資産を 未来世代のために保存
  • 2025年10月、記念イベントで保存活動の歩み、制作者、歴史的意義を紹介
  • 今後のウェブ保存の展望 についても議論

イベントカレンダー

  • 10月7日:The Vast Blue We(Del Sol Quartetライブ)

    • サンフランシスコ現地&オンライン開催
    • Del Sol Quartetによる新作演奏と共に 人類の協働の力 を音楽で表現
    • Wayback Machineの 1兆ページ保存の規模 を祝う
  • 10月9日:Sir Tim Berners-Lee & Brewster Kahle対談

    • サンフランシスコ現地&オンライン開催
    • インターネットの発展と社会的影響、保存の重要性 を議論
    • Sir Tim Berners-Lee(Webの発明者)、Brewster Kahle(Internet Archive創設者)が登壇
  • 10月16日:Library Leaders Forum 2025(オンライン)

    • Internet Archiveスタッフとパートナーによる 新サービスや活動報告
    • 21世紀の図書館が 研究をどう支えるか を議論
  • 10月21日:Doors Open 2025(物理アーカイブ見学会)

    • カリフォルニア州リッチモンド現地開催
    • 書籍・音楽・映像など物理コレクション の舞台裏を公開
    • 寄贈・保存・デジタル化・アクセス の流れを体験
  • 10月22日:The Web We’ve Built(1兆ページ達成記念式典)

    • サンフランシスコ現地&オンライン開催
    • Wayback Machineの 1兆ページ保存達成 を世界中で祝う
    • ライブ配信 と現地パーティで共同アーカイブの意義を共有
  • 10月27日:Wayback to the Future(オープンウェブの未来を語る)

    • ワシントンD.C. Georgetown University現地開催
    • オープンウェブの過去・現在・未来 をテーマに討論
    • Luke Hogg(FAI)、Brewster Kahle、Vint Cerf(Google)、Cindy Cohn(EFF)、Jon Stokes(Ars Technica)など著名登壇者

影響事例と参加呼びかけ

  • 1兆ページのアーカイブ は単なる数字でなく、人々の 生活・研究・記憶 に大きな影響
  • Wayback Machineは 移民裁判、個人史、学術研究、調査報道 などで活用
  • 利用者による 体験談の共有 を募集
  • ウェブ保存活動への寄付 も呼びかけ

プレスキットと取材案内

  • 1兆ページ達成に関する 報道用プレスキット をオンラインで提供
  • 利用者の影響事例、Internet ArchiveやWayback Machineのデータ、人気サイトの過去・現在比較画像 を掲載
  • 取材連絡先もプレスキットに記載

Hackerたちの意見

これ、技術的な記事だと思ったけど、何もなかったな。

統計データが見れたら面白いよね。ここにどれくらいのデータがあるのか気になるし、特にいくつかのページが時間をかけてアーカイブされてるから、分布も興味深いと思う。最近はページが重くなってるしね。

関連するブログ記事、ストーリーを募集してるよ: https://blog.archive.org/2025/09/23/celebrating-1-trillion-w...

archive.orgのピアミラーみたいなのがあればいいなと思う。メインのIAウェブアプリは、いくつかの異なる日付をクリックしようとするとすぐに怒っちゃうからね。もし、トレント方式でゆっくりミラーリングして、archive.orgからページをピアとして提供できる方法があったら面白いと思う。データの代替ソースとして登場できるし、archive.orgのアプリがユーザーの選択でそこから取得して、必要ならチェックサムを検証できればいいな。結局、自分のArchiveBoxを持ってるけど、まあまあの体験だよ。結局、アーカイブしたいものだけに役立つし、ほとんどのことはIAに行くから、そこにはたくさんあるしね。

「バージョン付き」トレントってあるのかな?正しいPGPキーがあれば、ビットトレントとパッケージシステムを組み合わせて、アップデート可能な配布ができるかも。

もし誰かがもっとデータを提供したいなら、ArchiveTeamっていう関連のボランティアグループがIAにデータを送ってるよ: https://archiveteam.org/

こんにちは、私はインターネットアーカイブのデータセンター/インフラチームを運営しています!この秋のいろんなイベントで会えるのを楽しみにしてるけど、チケット代が厳しいなら、プロフィールにあるメールで連絡してくれれば、可能な限り入れてあげるよ。

どんなイベントのことを言ってるの?

IAで働きたいけど、募集が少ないんだよね。

ねえ、Q. インターネットアーカイブのサイズってどのくらいなの?

世界中でイベントが開催されるの?それともチームが集まってる場所(サンフランシスコかな?)だけ?それにしても、IAのチームのみんなに感謝!あなたたちが提供してるものは人類にとってすごく大事だよ。

この偉業に関する技術的な詳細が知りたいな。例えば、どうやってクローリングを始めるのか、ストレージのこととか。

みんな知ってるけど、NSAはアメリカにあるサーバーにアクセスできるよね。悪意のある改ざんからアーカイブをどうやって守ってるの?不変のストレージとか使ってるの?ポスト量子セキュリティになってる?

インターネットの歴史にとって素晴らしいマイルストーンだね!

これらのページのインデックスってあるの?

ドメインごとの訪問統計があったらいいな。自分のサイトをホストしてる人が、アーカイブ.orgで自分のドメインとライブサイトの訪問者を比べられると面白いよね。

ジェイソン・スコット/@textfilesのトークが含まれてるといいな。彼の話はいつもめっちゃ楽しいから。

政府やデータにアクセスできる他の人たちが歴史を書き換えるのをどうやって防いでるの?ブロックチェーンみたいなものでハッシュ化してるの?歴史を書き換えられないっていうのは、世界にとって素晴らしい贈り物になるよ。