世界を動かす技術を、日本語で。

オルテガ仮説

概要

  • Ortega仮説 は、平均的な科学者の貢献が科学進歩に重要であるという主張
  • 一方で、 Newton仮説 は、少数の偉大な科学者が進歩を牽引するとする
  • 引用分析ではNewton仮説を支持する傾向が強い
  • 引用数が実際の影響力を正確に反映しているかは未解決
  • Ortega仮説の本来の趣旨と現代の使われ方には乖離が存在

Ortega仮説と科学進歩の構造

  • Ortega仮説 :平均的または凡庸な科学者が、科学の発展に大きく貢献するという見解

    • 科学的進歩は、多数の小さな専門的貢献の蓄積によるものとする立場
    • 主要なブレークスルーは、無数の小さな研究成果に大きく依存するという主張
  • Newton仮説 :科学の進歩は、少数の卓越した科学者によるものとする見解

    • Isaac Newtonの「巨人の肩の上に立つ」という言葉に由来
    • 主要な論文は、他の優れた科学者の論文を主に引用する傾向
    • 重要な論文や科学者が、引用ネットワークの中心に集中
  • 引用分析の結果

    • 物理学や犯罪学など、様々な分野で少数の研究者への引用集中が確認
    • 著名な科学者の小規模な論文も、無名な科学者の論文より頻繁に引用
    • 著名な科学者は、主にエリート大学や研究機関に所属

Ortega仮説への批判と議論

  • 引用数の限界

    • 引用数が科学的価値や影響力を正確に反映しているとは限らない
    • 科学者の社会的ネットワークの階層構造が、引用統計を歪める可能性
    • 実際には論文を読まずに引用するケースも多い
  • 理論論文と実験論文の違い

    • 理論論文は、将来の研究への広範な関連性を持つ傾向
    • 実験論文は、理論の基礎となるが引用されにくい傾向
    • 実験技術や装置の改良は、多数の研究者の貢献によるが、報告書ではあまり引用されない

Ortega仮説の由来と誤解

  • José Ortega y Gasset の著作『The Revolt of the Masses』に由来

    • Ortega自身は、科学の進歩は主に天才による枠組み構築に依存すると考えていた
    • 天才が作った枠組みの中で、平均的な人々が体系的な実験作業を担う必要性も認めていた
    • 「Ortega仮説」という名称は、彼の理論の一部のみを切り取ったもの
  • Ortegaの主張

    • 科学の進歩は、主に天才同士の相互作用によるもの
    • 一部の分野では、誰でもできるような機械的な知的作業も不可欠
    • 狭い専門分野に特化し、結果への深い理解や好奇心を持たない人々による貢献の存在

科学的影響力と引用の不平等

  • 引用の不平等性(Attention inequality)

    • 少数の論文や科学者に注目が集中する現象
    • 社会的・制度的な要因が影響する可能性
  • 科学的価値評価の課題

    • 現在の引用分析では、真の影響力や価値を測定するのは困難
    • データ選択や分析方法によるバイアスの懸念
    • 科学的進歩の本質を理解するには、多角的な評価が必要

Hackerたちの意見

有名な科学者のちょっとした論文でも、あまり知られていない科学者の論文よりもずっと引用されることが多い。これは、そういう引用がある論文の方が、実際にはもっと関連性があるかもしれない引用よりも真剣に受け止められる可能性が高いからなんだろうか。

主にステータスゲームだね。彼らは名声による信頼性を求めてる。エルデシュ数とかそういうのは、学界ではかなり重要で、ピアレビューの根本的な機能不全の一部でもある。「あの名前を知ってるから、これは真剣な研究に違いない」とか、「シュミットハーバーの論文に基づいてるなら、正当な研究に違いない」というバイアスがあって、ピアレビューは仮説や結果の冷静で中立的な評価ではなく、心理的で社会的なゲームになってる。さらに「これが正しいやり方だ」という感じの模倣の側面もある。今のピアレビューのやり方は、グッドハートの法則の完璧な例だよ。学界では一般的な慣行だったけど、正式に制度化されたのは1960年代の後半で、1990年代には完全に腐敗したシステムになってしまった。ジャーナルや学術機関は複雑な慣行やルールを作り、SEOみたいに、みんなそのルールを破ることにインセンティブを持つようになった。今では、すべての分野で研究のかなりの割合が出版の技術的基準を満たしているけど、ある分野では半分近くが再現できないし、研究資金や助成金をだまし取るための明らかな詐欺も多い。非公式な善意のコミュニケーションはうまく機能していたけど、査読者やジャーナルが利益を求めるようになると、状況が狂い始めた。

学術論文には「金持ちがますます金持ちになる」現象が確実にあるね。引用される回数が多い論文は「ランドマーク論文」となって、みんなが読む可能性が高くなるし、引用もされやすくなる。でも、ある時点からは特定のトピックや技術に関する文献レビューで「安全」または「デフォルト」の論文として引用されることもあるから、便利さから人々はそれを引用することがあるんだ。もっと関連性の高い論文があってもね。特に研究者がその分野をあまり知らない場合、引用回数が多い論文が関連性があると思い込みやすい。少なくとも会議では締切があるから、研究者は自分のbibtexファイルにあるものをコピー&ペーストしちゃうことが多いし、残念ながら文献レビューは後回しになりがちだね。私の経験では、CV/MLの分野では特にそうだった。もう一つの「金持ちがますます金持ちになる」現象は、有名な著者や機関が騒がしいけど簡単な「質」のシグナルになること。研究者が特定の分野についてあまり知らなくて、論文の独自の価値を判断する準備ができていない場合、その著者や機関の名声から論文が関連性があるか面白いと直感的に思い込むことがある。会議ではこれが簡単に見えるよ。有名な著者や機関のポスターは、何を見ているのかわからなくても、ほぼ自動的にたくさんの訪問者を引き寄せるからね。

他の仮説もあるかもね。 - ニュートンは、ほとんどの進展は巨人の肩に乗って成し遂げられると予測した。引用だけを見ると、これが真実のように思える。詳しくは https://nintil.com/newton-hypothesis を見てね。 - マシュー効果は、成功した人がさらに成功するという観察を科学出版に拡張したもの。大物はより多くの資金を得て、ジャーナルに簡単に掲載されるから、さらに露出が増えて、ラボを持ち、多くの論文に名前が載ることになる。詳しくは https://researchonresearch.org/largest-study-of-its-kind-sho... 。もし推測してもいいなら、いくつかの観察をしたい。まず、リソースが研究に大きな役割を果たすから、全体的な進展の方向は、特定のグループよりも経済に影響されることが多い。例えば、現代のスマートフォンの各コンポーネントは、大規模な資本注入によって超最適化された。次に、これは現実の世界であり、したがって何らかのパワー法則が適用される可能性が高い。正確な数字はわからないけど、私の予想では、上位1%の研究者が下位25%よりもはるかに多くの成果を出していると思う。

ニュートンは、ほとんどの進展は巨人の肩に乗って成し遂げられると予測した。ライプニッツも同じ時期にそうしたよ。これがオルテガの仮説を裏付けると思う。点をつなぐ人たちが偉大な科学者として見られるけど、その点が最初に存在しなければならない。点は、無数の無名の科学者や学者、書記、職人の仕事なんだ。点が揃ったら、必ず誰かが現れて最後の一撃を加えてつなげるんだよ。時には複数の人が同時にね。

ニュートンは、ほとんどの進展は巨人の肩に乗って成し遂げられると予測した。巨人たちも間違うことがあるから、「巨人たちが私たちの肩に乗っていた」という問題を解決する必要がある。アミロイドベータ仮説は、分野の巨人たちによる一握りの明らかに詐欺的だけど決して大きく挑戦されなかった結果に基づいて、アルツハイマーの研究を数十年も引き止めていた。クーンの「パラダイムシフト」モデルがこれを語っている。最終的にはダムが崩れるけど、それが起こるときは新しい巨人の突然の登場ではなく、何年もの平凡な実験作業の中で支援が徐々に失われることが一般的だ。今の天文学もそうで、決して満足のいくことのないΛCDMモデルが新しいデータの前でついに失敗している。しかも、それはウェッブや新しい機器からだけではない!古いデータも合わなかったけど、誰も気にしなかった。大陸移動説も似たような軌跡をたどり、数世代にわたるかなり説得力のある地質学が確立された仮定に挑戦することができなかったけど、60年代にようやくすべてがうまくいった。

すべてのことに言えるけど、両方とも真実かもしれない。私たちは、少数の人々に後から偉大さを帰属させるかもしれないけど、最も有用なスレッドを見つけるためには、多くの非常に興味深い/野心的な人々が必要だ。実験室を運営したり、データをカタログ化したりするためにね。事後的に「これが本当に役立った」と言うことになる。もしあらかじめ微積分や「星を追跡すること」がこんなに多くの有用な発見につながるとわかっていたらよかったのに!

マシュー効果 - 成功した人がさらに成功するっていう観察を科学出版にまで広げたものだね。有名な人たちはもっと資金を得て、ジャーナルに簡単に掲載されるから、さらに露出が増えて、研究室を持つことになったり、たくさんの論文に名前が載ったりする。歴史上の偉人たちの中には、こういうのがたくさんいるよ。歴史上の偉大な人物を挙げると、ほとんど例外なく、裕福でコネのある家庭に生まれて、その道を歩むことができたんだ。自力で成功した人も確かにいるけど、そういう人たちはもっと面白いことが多いね。でも、数学や科学、哲学の歴史で簡単に名前が挙がる人たちは、ほとんどが裕福な家庭の子供で、自分を育てるための時間やリソースを持っていたんだ。

引用はこういったことを判断するには不十分な指標だと思う。論文を書く経験から言うと、私は世界の明確なモデルを形成していて、イントロを書くときには、その作業を基にするための明確な概念のシリーズを持っている。これらのアイデアを裏付ける引用に関しては、特定の論文よりもむしろ人を関連付けることが多くて、その人の適切な論文を探して引用することが多い。これは、講演やポスター、単なる会話など、他の手段でその関連付けを作ることが大きな影響を与える可能性があることを示唆している。それは、引用によって測定される「科学的進歩」を推進するさまざまな人格やコミュニティの影響を示唆している。

完全に同意する。引用パターンを観察していると、私が関わったことがないものでも、特定の著者やグループがアイデアや結果に注目を集める理由がいろいろあって、それが引用パターンを駆動していることがわかる。これは、特定の「人気」論文の前に同じ結果が無視されるような奇妙なパターンを生む。たとえ「人気」論文が非常に漸進的であったり、以前の研究の再現であっても、以前の著者が同じアイデアを議論していても、より新しいカリスマ的な著者が登場することで忘れ去られることがある。さまざまな研究が、撤回されたゾンビ論文が撤回されることなく高い引用率を維持し続けることを示している。これについては、もう考えるのを諦めた。ほとんどの場合、これは単なる最近の可用性バイアスで、人々が引用に対して基本的に怠惰であったり、時間がなかったりするからだ。時には、古い文献が単に忘れ去られ、新しい著者が何らかの理由で注目を集めることでアイデアが議論されることもある。多くの場合、特定の人に対するカルト的なバズがあって、その人の人格やプレゼンテーションが重要視されることがある。ある人が天才としての評判を得ると、彼らが言うことや示すことは以前に言われたことや示されたことではないと人々が仮定するようになり、引用パターンにおいて自己実現的な予言が生まれる。彼らの言っていることが有効かどうかは関係ない、ただ多くの注目と同意を集める必要がある。いずれにせよ、私の分野では、研究者が有名である理由は有名であること以外にはあまりないと考えている。マシュー効果は現実で、さまざまな理由で非常に迅速に起こり得る。人々はまた短期的な注意しか持たず、歴史に対する記憶も薄い。これは特に最近の文献に当てはまる。1995年以前の引用パターンは、現在の状態を代表していないと思う。

引用は悪用されやすいね。特にコンピュータサイエンスの分野では、著者たちが互いの平凡な論文を引用したり共著したりするのを見たことがある。その結果、非常に高い引用数や出版数が得られるんだ。なぜなら、仕事が多くの人に分担されているから。

面白いね、そんなのがあるなんて知らなかったよ(オルテガ・イ・ガセットの本をかなり読んでるのに)。これをT. S. クーンの『科学革命の構造』のパラダイムシフトと比べてみてよ。

「科学革命の構造」を強くおすすめするよ。オルテガとニュートンの仮説をうまく結びつけていると思う。

関連情報: オルテガ仮説 - https://news.ycombinator.com/item?id=20247092 - 2019年6月(コメント1件)

インターネットがある今、どれだけのブレークスルーが難しかったかを考えるのが難しくなったよね。情報が瞬時にどこにでもある前は、発見が数年離れて同時に行われることが普通だったけど、実際にはどちらの科学者も相手の研究を知らなかったんだ。その2つ(またはそれ以上)の似たような発見がいつ起こったかの距離が、どれだけ難しかったかを示しているんだ。数年離れていると、すごく難しかったに違いないし、数ヶ月や数日離れていると、前の発見からの明らかな結論だった可能性が高いよね。そうなると、ただの出版競争になっちゃう。

僕にとって、平凡な科学者の最大の貢献は、次の世代に自分の分野を教えることだと思う。科学を前進させるためには、その分野を理解している人が十分にいる必要があって、次の大きな発見のピースを組み合わせる確率を高めることができるんだ。だから、人数が重要で、天才の要素よりも大事だと思う。一方で、十分な人がその分野で働いていないと、知識の全体的な理解が失われることもあるよね。

同意!その方向性の素敵な短編小説が、スコット・アレクサンダーによって書かれてるよ。https://slatestarcodex.com/2017/11/09/ars-longa-vita-brevis/

そうだね。人間の文明は基本的に、時間を超えたアイデアの伝達に基づいている。古いアイデアがなければ(ニュートンの「巨人の肩の上に立つ」)、長期的な進歩はないんだ。確立された知識を伝えることも、新しい知識を生み出すことと同じくらい文明にとって重要だよ。

面白い例だと思うんだけど、アメリカではアブラハム戦車を作り続けているんだ。戦争中じゃないし、これらの戦車を使う必要もない。だから、物事を合理的にするために、いくつかの国にそのお金を使わせる条件でお金を渡している。なんで作り続けるかって?戦争の初日からその戦車を作れる人が必要だから。何ヶ月もかけて人を育てるわけにはいかない。すぐに準備ができていなきゃいけないから、平和な時代には「理由もなく」戦車を作っている人たちがいるんだ。

数字のゲームが天才の要素よりも重要だという意味だね。数字のゲームは、君が思っている理想的な方法では機能しない。 mediocreや悪い人が科学者になりすぎると、その中の何人かは詐欺や考えなしのモデル作りに関わってしまって、良い科学者の時間を無駄にすることになるんだ。彼らは決してうまくいかない結果を再現しなきゃいけなくなるからね。

平凡な野球選手がチームをワールドシリーズに連れて行くし、平凡な兵士が特別部隊のコマンドーじゃなくても戦争に勝つんだ。原則はかなり一般的だね。

アリストテレスが言ったように、「できる人はやり、理解している人は教える」ってことだね。

逆に言うと、十分な人数がその分野で働いていないと、知識の全体が失われることもあるよ。特に、その仕事が機密扱いの場合はね。熱核兵器のインターステージに必要な重要な材料であるFOGBANKの製造は、2000年までに失われちゃったんだ。製造に関わっていた人が少なすぎて、知っていた人たちは引退したり、他の仕事に移ったりしてしまったから。あれはエアロゲルのような物質だと言われているよ。再び理解するのに5年と何百万もかかる逆エンジニアリングが必要だったみたい。今回はちゃんと文書化したんじゃないかな。

オルテガがフロントページに載ってるのを見るのはすごく嬉しい!彼は素晴らしい思想家で、すごく博学で同時代の哲学者たちともつながりがあったけど、読みやすさも抜群なんだ。彼は技術的なことはあまり使わないし、難しい新語も滅多に使わない。思考の流れのようなスタイルで書いていて、講義に似てる(彼は自分の著作を講義に再構成したり、その逆もやってたと思う)。彼の作品の中でおすすめなのは、 - 『大衆の反乱』(記事に出てきたやつ)で、工業化した大衆社会の問題や自己喪失、リベラル民主主義への脅威を分析している。彼は「大衆個人」(hombre masa)という概念を提唱していて、工業社会に生まれた男が享受する進歩(技術的・政治的)を当然のこととして受け入れ、その進歩の起源や自分との関係を問い直さないから、非リベラルなレトリックに流されやすくなるって言ってる。これは1930年頃に書かれたもので、第二次世界大戦につながる力を予見している部分が多い。出版当時は国際的な成功を収めたけど、今でも不気味なほど現代的だよ。 - 彼の『技術についての瞑想』は、技術に関するかなりシンプルだけど正確な哲学を示している。技術の発展の歴史を、偶然(例えば、火)から、職人技、機械の時代(技術者が技術を作る技術を作る時代)まで語っている。彼はまた、人間が自己陶酔(ensimismamiento)と不快感について考えること、そして変革を決意する段階の二段階サイクルを説明している。アイデア自体は人生を変えるものではないかもしれないけど、すでに直感していたことをきちんとモデル化して整理してくれる本なんだ。オルテガの考えは、僕がプロジェクトの意味を探しているときによく思い出すことがある。HNの他の人にも興味があるかもしれないね!

それはあり得るね。一般相対性理論は並外れた天才によって考案されたけど、水星の近日点の測定は、特に目立たないけど努力を惜しまない多くの人々によって行われた。あの驚くほど正確な測定がなければ、一般相対性理論は有効な理論として受け入れられることはなかっただろうね。

そうだね、CEOや創業者が会社のブレークスルーに対してすべての功績を得るのと同じように、科学者たちも小さなブレークスルーをうまくまとめた場合、それぞれの進展に対してすべての功績を得るんだ。人間は全体を部分よりも優先するから、内容のラベルが重要なんだよね。