世界を動かす技術を、日本語で。

MITがAIと科学的発見に関する論文のプレプリントの撤回をarXivに要請

概要

  • MITはAIと科学発見に関するプレプリント論文の研究不正を指摘
  • 内部調査の結果、arXivとThe Quarterly Journal of Economicsに撤回要請を提出
  • データの信頼性と研究の真実性に重大な懸念を表明
  • 著者は既にMITを離籍しており、撤回手続きが進行中
  • MITは研究の透明性と誠実性の維持を最優先事項と強調

MITによるAI関連論文撤回要請の経緯と声明

撤回要請の背景

  • 2024年11月、arXivにプレプリント論文「Artificial Intelligence, Scientific Discovery, and Product Innovation」が投稿されることを確認
  • 論文の研究誠実性に関して、外部から深刻な懸念が提起されることを認識
  • MIT内で機密性を保った内部調査を実施すること
  • 調査結果を受け、arXivおよびThe Quarterly Journal of Economicsに対し論文の撤回を正式に要請すること
  • MITのCommittee on Discipline(COD)からarXivへの書簡で、データの出所・信頼性・妥当性や研究内容の真実性に自信がない旨を明言すること

arXivと著者への対応

  • arXivの規定により、著者本人のみが撤回申請できることを確認
  • MITは著者に撤回申請を指示したが、著者は未対応であること
  • 研究記録の明確化のため、MITがarXivに対し論文の速やかな撤回処理を要請すること
  • プレプリントは査読前の公開物であるため、研究不正の影響緩和措置として対応を急ぐこと

MITの研究誠実性に関する立場

  • 研究誠実性はMITの活動の根幹であり、最重要事項であることを強調
  • 問題発生時には、MITの方針・機密性を保ったプロセスに従い調査を実施すること
  • 研究誠実性に関するMITの方針・手続きはオンラインで公開されていること

関与教授のコメントと論文の影響

  • 論文の脚注で謝辞が記載されているDaron Acemoglu教授とDavid Autor教授が共同声明を発表すること
  • 当該論文は未査読だが、AIと科学に関する議論で既に広く参照されていることを確認
  • 両教授は、研究の信頼性・妥当性・真実性に疑念を持ち、MITの適切な部署へ報告したこと
  • 調査結果の詳細は学生のプライバシー保護とMITの方針により非公開であること
  • 論文の学術的・社会的議論への影響を懸念し、現時点で論文の主張を引用・参照しないよう呼びかけること

今後の対応と提案

  • 研究記録の正確性を確保することはMITの責務であると再度表明
  • 関係者・研究者に対し、当該論文の内容や結論を今後の議論や研究に用いないよう注意喚起すること
  • 研究不正の防止と透明性確保に向けた継続的な取り組みを推進すること

Hackerたちの意見

その論文、数ヶ月前にHNスレッドがあったよね。https://news.ycombinator.com/item?id=42115310

誰かがすでに怪しいって気づいてくれてよかったね。https://news.ycombinator.com/item?id=42128532

ありがとう!マクロ拡張: 人工知能、科学的発見、製品革新 [pdf] - https://news.ycombinator.com/item?id=42115310 - 2024年11月(47コメント)

初印象: 1. ほとんどのプロットのデータ(付録参照)が偽物っぽい。実際のデータはそんなにきれいじゃないよ。2. 2022年5月、chatGPTがgenAIを注目させる6ヶ月前に、どうやって2年目のPhD学生が大手材料研究所に1,000人以上の社員で実験をやらせることができたの?どんなモデルを使ったの?GANs+拡散ってだけしか書いてない。技術的な詳細は、これらの概念が何かの高レベルな一般的説明ばかりで、具体的なことは何もない。「短いパイロットプログラムの後、研究所は2022年5月にモデルの大規模な展開を始めた。」大企業で働いたことがある人ならわかるけど、こんなのありえないよ。

ほとんどのプロットのデータ(付録参照)が偽物っぽい ここでベンフォードの法則分析が適用できるかな?

ポイント2について、説明されている通りに研究が実施不可能だというのは、マイケル・ラコールにとっても問題だったみたい。あまり評価されていない詐欺検出のヒューリスティックのようだね。https://en.wikipedia.org/wiki/When_Contact_Changes_Minds https://citeseerx.ist.psu.edu/document?repid=rep1&type=pdf&d... > 私たちが自分たちの研究を計画する際にその研究のデータを調べたところ、2つの特徴に驚かされた。投票者の調査回答は、他のパネル調査データで観察されたものよりもはるかに高い再テスト信頼性を示し、パネル調査の回答率と再インタビュー率は予想以上に高かった。> その会社は、ラコールとグリーン(2014)で説明されている採用手続きの多くを実行する能力がないと否定した。

科学者が異なるタスクに費やす時間の月ごとの記録は、表面的には馬鹿げてる。提案された方法論、科学者の記録を自動的にテキスト分析して、AI導入前のほぼ一定の時間配分を1年分も得るなんて、全く信じられない。そんなデータの質は想像を絶するほど高くなければならない。

% gunzip -c arXiv-2412.17866v1.tar.gz | tar xOf - main.tex | grep '\bI have\b' 要約すると、私は3つの事実を確立しました。まず、AIは材料発見の平均率を大幅に増加させます。次に、それは初期の生産性が高い研究者に不均等に利益をもたらします。最後に、この異質性はほぼ完全に判断の違いによって引き起こされます。これらの結果の背後にあるメカニズムを理解するために、科学における人間とAIの協力のダイナミクスを調査します。 \item 私が使った他の方法と比較して、AIツールは望ましい特性を持つ可能性のある材料を生成します。 \item AIツールは、私が使った他の方法よりも物理的構造がより明確な潜在的な材料を生成します。 % gunzip -c arXiv-2412.17866v1.tar.gz | tar xOf - main.tex | grep '\b I \b' | wc 25 1858 12791 %

参考までに、トークの後のQ&Aで、彼はそれがGANではなくGNN(グラフニューラルネットワーク)だと主張しているよ。(このQ&Aでは、観客は研究の妥当性についてあまり疑問を持っていないみたい。) https://doi.org/10.52843/cassyni.n74lq7

彼はこの研究を行う前に、「MITの人間を実験対象として使用する委員会からID E-5842のIRB承認を得た」とも主張しているんだ。つまり、彼がまだ博士課程の学生でもなかった時期にね。

ポイント1には少なくとも表面的には同意するけど、ポイント2については、MITやスタンフォードのような大きな機関と密接な関係を持つ企業が、最先端の研究実験を展開することに興味を持っていることが多いよ。特に、すでに研究室やPIとのつながりがある場合はね。

もし論文が高ボリュームの分野で再現が難しいなら…再現されることはあるのかな?私たちが問うべき質問は、その分野にどれだけの詐欺的な論文があるかってことだね。実際、MLの研究者たちが何年も数字をでっち上げていた場所で働いたこともあるよ。

MITの記事は詳細があまりないね。WSJの方が情報は多いけど、具体的なことはまだわからないね: https://www.wsj.com/tech/ai/mit-says-it-no-longer-stands-beh... > この論文は、2024年のノーベル経済学賞を受賞したMITの経済学者ダロン・アセモグルとデイビッド・オータによって推進されたんだ。彼らは、材料科学の経験があるコンピュータ科学者から、技術の仕組みや、知らないラボがどのようにイノベーションを得たのかについて疑問を持たれて、1月に接触されたと言っている。その懸念を解決できなかったため、彼らはMITに報告し、レビューが始まったんだ。

https://archive.ph/r63jR

[flagged]

元二年生の博士課程の学生からの情報みたいだね。追い出されたなら、かなり深刻なことだね。

こういう高プロフィールな違反者たちがどうなるのか、いつも気になるよね。以前、Appleの高級社員が何か犯罪を犯して刑務所に行った時に、Googleニュースのアラートを作ったことがあったけど、その後彼のことは一切見かけなかった。彼の経済学のキャリアは終わったんじゃないかな(彼はMITに入る前にNY連邦準備銀行で働いてたし)。今後、彼は何をするんだろう—ホワイトカラーの仕事を見つけられるのか、それとも小売や飲食業に追いやられるのか気になるな。

我々の理解では、arXivに掲載された論文の著者だけが撤回リクエストを提出できるんだ。著者にそのリクエストを提出するように指示したけど、今のところ著者はそれをしていないみたい。このことと「元二年生の博士課程の学生」という微妙な言及から、彼らが公の声明を出さなければならないのも理解できるね。プライバシーの必要なラインを守りながら、何が起こっているのかを示すのが上手だと思う。著者は、論文をそのままにしておいて新しいポジションに移るつもりだったのかもしれないけど、MITが公の声明を出して、著者が静かに撤回するよりもずっと大きなニュースにしてしまうとは思わなかったんじゃないかな。

著者がusername@mit.eduのアカウントでサインインしていることを考えると、MITはそのアカウントを引き継ぐことができるかもしれないね。追記:このコメントは部分的に真面目だったけど、MITへの法的アドバイスとしては意図していないよ。

なんと、この論文はすでに50回も引用されているみたいだね。取り下げられてもあまり気にしないけど、古い出版社なら、少なくとも論文に関する問題についての訂正通知やコメントが掲載されるからね。どこかでこの論文が引用されていて、arxivのソースに辿っても、研究に関する争いについては全く知らされないんだ。プレプリントサーバーにはここに少し弱点があるね。

ピアレビューがないことに伴う弱点だね。モデレーションはあるけど、それと同じだとは考えない方がいい。研究を信じるってことは、著者を信じるか、自分で論文をレビューすることを意味する。もし撤回があった場合、著者がその理由をコメントするか、前と同じように自分で探さなきゃいけない。[0] 例えば、arxiv/0812.0848:「この論文は、Triebel空間の重要な定義エラーのために著者によって撤回されました。」

50件の引用のほとんどはプレプリントサーバー(arXivみたいな)やアグリゲーター(ResearchGateみたいな)だね。査読付きの研究論文での引用数を数えるのはいいかも。> 研究に関する争いについては絶対に知らされないよ。arXivは査読じゃないから、WordPressやMedium、Blogspot、X/Tweeterと同じくらい信頼性がない。主な違いは、投稿がHTMLじゃなくてPDFになってること。とてもバカなケースを避けるための招待制があるけど、かなり弱いよ。変な暗号学の「ブレイクスルー」を覚えてるけど、それがarXivに掲載されて、最初の5ページは9の法則の説明で、次が疑わしい高速因数分解アルゴリズムだったんだ。[そのプレプリントはhttps://news.ycombinator.com/item?id=20666501にリンクされていて、私はそれに返信したよ(s/module/modulo/g)]

2024年11月のこの論文を分析した素晴らしいTwitterスレッド: https://x.com/Robert_Palgrave/status/1856273405965693430

Twitterを使ってない人がこれを読む方法ってあるの?

ありがとう。Twitterでは、イーサン・モリックがロバート・パルグレイブがこの調査を引き起こした科学者かもしれないとほのめかしているみたい。

いいTwitterスレッド それは逆説だね。私だけかもしれないけど、3つ以上の「投稿」が必要なら、ブログに書いてTwitterからリンクすればいいと思う。それを読み進めるのは苦痛だった(結局できなかったけど)。

私の意見では、その論文は削除されるべきではないと思う。代わりに、プレプリントに関する懸念と、それが詐欺である可能性が高いことを示す注釈を追加すればいいんじゃないかな。追記:その論文が引用されているので、他の人がそれを参照して、引用している論文に実質的な影響を与えるかどうかを判断する必要があるかもしれない。もし論文が削除されたら、それはただの空白になっちゃうよ。

[死んでる]

arXivに「ここに論文があったけど、撤回された」というページがあればいいのに。

これが論文が撤回されるときの現実だね[1]、MITが論文の撤回を求めた[2]。論文を取り下げるように求めたというニュースタイトルは微妙に間違ってる。[1]: https://info.arxiv.org/help/withdraw.html#:~:text=Previous%2... [2]: https://economics.mit.edu/news/assuring-accurate-research-re...

同意する、罪は公に裁かれるべきだ。でも、詐欺的な論文を引用することを防ぐための安全策が必要だね。問題が解決されるまで、引用された論文には警告を付けるべきだと思う。

この論文は、2024年のノーベル経済学賞を受賞したMITの経済学者ダロン・アセモグルとデイビッド・オータによって支持されていた。彼らは1月に、材料科学の経験を持つコンピュータ科学者からアプローチを受け、その技術がどのように機能するのか、そして彼が知らなかったラボがどのようにイノベーションを達成したのかについて疑問を持たれた。彼らはその懸念を解決できず、MITに報告し、レビューが始まった。だから、PhD学生は追い出されたかもしれない。でも、「支持した」人たちはどうなの?もし彼らがその学生と一緒に働いていたなら、1000人以上の材料科学者がいる神話のようなラボが実際には存在しないか、存在しても実際にはAIツールを使っていないことに気づいていたかもしれない。

明らかに、謝辞に名前が挙がっている21人の誰もデータセットの出所を疑問視しなかったみたい。一人はその研究についてかなり人気のあるTwitterスレッドも書いてた。最近の出来事について通知されたとき、彼は「確かに論文で使われたデータは信頼できないようだ」と短く返事した。[名前を挙げる必要はないと思うけど]

どこから引用してるの? 編集: WSJの記事だった: https://www.wsj.com/tech/ai/mit-says-it-no-longer-stands-beh...

学界へようこそ…こういう「有名な」教授がいて、たいていクズだよね。彼らのほとんどは論文をしっかり読むことすらしない。私もその下にいて、彼の名前を論文に入れさせられてるけど、私が書いたことには全く気づいてない。残念ながら、この大学にいる間は内部告発するのは安全じゃない。いいことは、素晴らしい共同指導教員がいて、状況を完全に理解してくれてることかな。

MITは学生を犠牲にして、自分たちの責任を隠している。アセモグルとオータは注目を集めたがりで、メディアにも詳しくて裕福な教授たちだから、彼を支持していた。2年目のPhD学生が、業界での足跡や連絡先を残さずにこれを成し遂げるなんてあり得ない。彼の単著論文の要約の最初の段落をざっと見ただけでも警告が鳴るべきだった:「AI支援の研究者は44%多くの材料を発見し、特許出願が39%増加し、下流の製品イノベーションが17%増加した」。工業材料科学研究に基本的な知識がある人なら、そんな二桁の数字には疑いを持つだろう - 一桁の改善ですら非常に珍しいのに。

これは著者がZoomで行ったこの論文に関するセミナーの録音です: https://cassyni.com/events/MiPYGu3qzKP5MQFWNUn9Tb 振り返ってみると、彼が嘘をついているときはスクリーンやカメラを見ないというサインがあるみたいで、目が上や左、右、前以外のどこかを見ているんだよね。怖いのは、この即興で作り上げる習慣が、もうかなり根付いていて、著者の科学的な領域に限らないかもしれないってこと。

どうやら、彼は自分の足跡を隠そうとするために偽のウェブサイトを作ろうとしたらしく、2025年1月12日にドメインを登録したみたい。おそらく、Corningが彼が働いていた会社だと見せかけようとしたんだ。この件でWIPOの苦情が出て、Corningがドメイン名の移転を強制したんだ: https://www.wipo.int/amc/en/domains/decisions/pdf/2025/d2025...