世界を動かす技術を、日本語で。

インターネットアーカイブにおけるFiveThirtyEightの記事

概要

fivethirtyeight.com21,350ページInternet Archive に保存 2008年3月からの初期記事と著者ごとの 執筆数 を紹介 Nate Silverをはじめとする 主要執筆者 の一覧 年度別・著者別での アーカイブページ の閲覧が可能 初期記事の 主なトピック や内容も抜粋

fivethirtyeight.com アーカイブ概要

  • fivethirtyeight.com は、選挙予測やデータ分析で有名な米国ウェブサイト
  • Internet Archive により、 21,350ページ 以上が保存
  • 2008年3月からの 初期記事 も多数収録
  • 年ごと、執筆者ごとに記事を ブラウズ 可能
  • データ分析、世論調査評価、選挙戦略など多岐にわたる内容

2008年3月の主な記事一覧

  • FAQ(よくある質問)Pollster Ratings など、基本情報と分析記事
  • 州ごとの選挙情勢 や世論調査の動向分析
  • Nate Silver による初期の選挙予測・分析記事が中心
  • Intrade との比較や、民主党・共和党の動向
  • Swing State AnalysisNew Maps など、選挙地図・スウィング州分析

主要執筆者一覧(執筆数順)

  • Nate Silver (4,966本):サイト創設者、選挙分析の第一人者
  • Neil Paine (1,428本):スポーツ・政治データ分析
  • Walt Hickey (1,210本):カルチャー・データジャーナリズム
  • Aaron Bycoffe (1,168本):選挙予測・データ可視化
  • Galen Druke (747本):ポッドキャスト・政治解説
    • その他、 Oliver RoederNathaniel RakichHarry Enten など多数

アーカイブの利用方法

  • 年度別 (2008年~2025年)での絞り込み閲覧
  • 著者別 (全558名)での絞り込み
  • ヘッドライン記事タイトル から直接アクセス可能
  • 初期アーカイブ は選挙予測手法やデータ分析の歴史を知る資料

まとめ

  • fivethirtyeight.com は、選挙・スポーツ・社会現象のデータ分析で高い評価
  • Internet Archive で、過去記事や分析手法の変遷を追体験可能
  • データジャーナリズムや選挙分析の研究にも有用なリソース

Hackerたちの意見

Githubのリンク: https://github.com/palewire/fivethirtyeightindex.com

これは、今Fivethirtyeightを所有している人(ABC?)が、サイト上の記事のアーカイブを全部削除しちゃったからなんだよね。

Archive.orgのインデックスだけじゃ足りないんじゃない?ドメインを管理している人が望めば、robots.txtで消しちゃうこともできるし。

FTEの記事をアーカイブすることがなんで重要なのか分からなかったけど、ちょっと調べたらこんなのが出てきたよ: > インターネットから消えた数千のFiveThirtyEightの記事 https://www.editorandpublisher.com/stories/thousands-of-five... ここでの議論もあるよ: ABCニュースがすべてのFiveThirtyEightの記事をオフラインにした https://news.ycombinator.com/item?id=48152553 ディズニーがFiveThirtyEightを消した(ナイト本人の記事) https://news.ycombinator.com/item?id=48197703

あんまり詳しくは知らないけど、彼らの記事に出会うたびに「素晴らしい」ジャーナリズムだなって思ってた。おまけに、すごいインフォグラフィックやインタラクティブなデータビジュアライゼーションもあったし。

"ベン・ウェルシュって誰?"って思ってる人のために。こんにちは。私の名前はベン・ウェルシュです。アイオワ州出身で、ニューヨーク市に住んでいます。私は記者であり、編集者であり、プログラマーです。これらのスキルを使って、ストーリーを見つけて伝えるのが私の仕事です。世界最大のマルチメディアニュースプロバイダーであるロイターで働いていて、そこでニュースアプリケーションデスクを立ち上げました。その役割では、クライアントに利益をもたらし、読者に情報を提供し、報道者を力づけ、公共の利益に貢献するダッシュボードやデータベース、自動化システムの開発をリードしています。[...] ~ https://palewi.re/who-is-ben-welsh/

ベン・ウェルシュがウェールズ出身じゃないなんて信じられないし、FiveThirtyEightはウェールズとは関係ないんだね。

ベンはデータジャーナリズムの世界でお気に入りの人の一人だよ。彼はこの分野で素晴らしいトレーニングコースをたくさん作ってるんだ。例えば: - https://github.com/palewire/first-python-notebook - https://github.com/palewire/first-web-scraper - https://github.com/palewire/first-graphics-app

(提出されたタイトルは「ベン・ウェルシュがインターネットアーカイブにあるすべてのFiveThirtyEightの記事のインデックスを作った」だったけど、今は変更したよ)

自分の成果にコンプレックスがあるなら、そのリンクはクリックしない方がいいよ(笑)

ベンは大好きだけど、タイトルはシンプルに「インターネットアーカイブによって保存されたFiveThirtyEightの記事のインデックス」でいいんじゃない?

でも、それは誤った帰属だね。インターネットアーカイブがインデックスを作ったわけじゃなくて、ベンが作ったんだ。そしてインターネットアーカイブがそのインデックスをホストしているわけじゃなくて、ベンがしてる。

538の完全なWARCアーカイブを手に入れたいんだけど、どうやってフレンドリーにやるの?歴史の追跡には興味ないから、インターネットアーカイブの最後のバージョンが欲しいだけなんだ。

これについてたくさん見かけるけど、他のウェブサイトがオフラインになるのと何が違うの?

これは歴史的に見ても重要なことだと思うし、ディズニーは世界で最も大きくて裕福な企業の一つだからね。「うわ、これはすごい無責任だな」とか「うわ、これには何か理由があるのかな…彼らがバカじゃないとしたらだけど?」って感じ。

https://www.natesilver.net/p/disney-erased-fivethirtyeight ここに大体の数字があるよ:ディズニー時代の約10年間で、FiveThirtyEightは週に約20本の記事を公開してたんだ。各記事の制作にはリサーチ、執筆、グラフィックス、編集を含めて約20時間かかるとしよう。計算してみると、ABCニュースが削除したのは約200,000人時の作業になるんだ。

サッカーには詳しくないけど、リオネル・メッシに関する記事はめっちゃ良かったと思う。https://web.archive.org/web/20140701122958/http://fivethirty...

残念ながら、アーカイブ版では最も重要なビジュアライゼーションの多くが壊れちゃってるんだ。銃による死亡数のビジュアライゼーションや、Pハッキングのインタラクティブも含まれてる。https://web.archive.org/web/20230205124354/https://fivethirt... それらのインタラクティブなビジュアライゼーションを他の誰も体験できないのはちょっと悲しいね。でも、承認比較ページがまだ動いてるのを見るのは嬉しいよ。https://web.archive.org/web/20241031232233/https://projects....

なんで壊れてるのか気になるな。ウェイバックマシンはJavaScriptを動かせるみたいだし。ビジュアライゼーションはサーバーに依存してるのかな?それともウェイバックマシンのクローリングに含まれてない他の資産が必要なのかな?

関連: ディズニーがFiveThirtyEightを消した https://news.ycombinator.com/item?id=48197703