世界を動かす技術を、日本語で。

ChatGPTを駆使するアマチュアがエルデシュ問題を解決

概要

  • 23歳のアマチュア60年未解決の数学問題ChatGPT Pro の力で解決
  • AIが従来と異なる新しい方法 で証明を提示
  • 専門家も AIの手法の独自性と応用可能性 に注目
  • 問題は Erdősの「primitive set」理論 に関するもの
  • 今後の 数学研究やAI活用 への期待が高まる

ChatGPTが解決した60年未解決の数学問題

  • Liam Price、23歳、数学の高等教育なし

  • ChatGPT Pro(GPT-5.4) を利用し、 Erdős問題 の一つを解決

  • 問題は 「primitive set」 と呼ばれる、互いに割り切れない整数集合に関するもの

  • Erdős sum というスコアで集合の特性を評価

  • Erdős sumの下限が1 になるという予想があったが、長年証明されていなかった

    • Jared Lichtman が2022年にErdős sumの上限を証明
    • 下限については専門家も証明に失敗
  • Priceは AIに問題を入力、ChatGPTが 独自の新しいアプローチ で証明を提示

  • 出力は粗かったが、専門家の LichtmanとTerence Tao が内容を精査・簡略化

AIによる数学的発見の意義と今後

  • 従来のアプローチとは異なる発想 で問題を解決

  • 人間の思考の偏り を回避するAIの強みが明らかに

  • Taoによれば、「 大きな数の構造に対する新しい考え方」を発見

  • Lichtmanも「 問題群に共通する直感が裏付けられた」と評価

  • 他の難問にも応用可能性 が期待される

    • AIの証明には 専門家の解釈と整理 が必要
    • AIと人間の協働による新たな数学研究の可能性

AIと数学研究の今後

  • AIの数学分野への応用 の進展
    • 特に 未解決問題や新規アプローチ への期待
  • 人間の思考の限界 を補うAIの役割
  • 証明の自動化や新しい発見 の加速
  • 専門家によるAI出力の検証と発展 が不可欠
  • AIと人間の協力 による数学の革新

参考情報

  • 問題の詳細や証明内容は www.erdosproblems.com/1196 で公開
  • Erdős問題 やAIによる証明の最新動向を掲載

Hackerたちの意見

ここにチャットがあります:インターネットを検索しないでください。これは「数論と原始集合」の数学問題に対して、どれだけ非自明で新しい創造的な証明を作れるかを試すテストです。問題の完全な無条件の証明または反証を提供してください。{{problem}} 忘れないで - この無条件の議論には、非自明で創造的かつ新しい要素が必要かもしれません。それから「80分17秒考えた」 https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba...

同じプロンプトを試したけど、無料プランでは全然近づけなかった。

私は20分かかった。プロ。 https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a... でも、うまくいったかどうか知るために数学が得意だったらよかったな。

5.5 Proで試してみたよ、Extended Thinking。17分間: ----------------------------- うん、実際に提案された境界は正しいし、定数1は鋭い。w(a)を1/alog(a)とすると、任意の原始集合A⊂[x,∞)について、∑w(a)≤1+O(1/log(x))が成り立つことを証明するよ。これは要求された1+o(1)よりも強いんだ。 https://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6...

https://archive.ph/2w4fi

人間も、そして私たちが作る機械も、問題を加算的に解決することが多いんだよね。つまり、既存の基盤の上に構築していくから、考え方が固定化されちゃうことがある。人は車輪を再発明するのを嫌がるからね。だから、ナイーブなLLMを使って、専門家たちが試さなかったようなことを思いつくのは驚くことじゃないと思う。LLMは、こういう限られたケースで問題へのアプローチを変える手助けができると思うんだ。正しい必要はなくて、誰かに代替案を提供できれば、それが何かを変えて解決に繋がるかもしれない。ただ、Erdősの問題の実用的な価値が何なのかは全く分からないけどね。もしこれがLLMがゴミじゃないことを示しているかって聞かれたら、1928年に数論に何百万ドルも研究費を使うべきかって聞かれてるみたいな感じ。答えはノー、オフィスから出て行って。

「ChatGPTの証明の生の出力は実際にはかなりひどかった。だから、専門家がそれをふるい分けて、何を言おうとしているのかを理解する必要があった」とリヒトマンは言っています。これが、私が数学の論文を読むときの気持ちです。

この段階で、解決されていない「ドライラボ」問題の巨大リストを持つGitHubリポジトリを作って、毎回の新リリースでそれを解決しようとするハーネスを立ち上げるべきだね。

それ、実際に素晴らしいアイデアだね。

実際、テレンス・タオや他の数学者たちが維持しているリポジトリがあって、彼らはLLMを使って問題の解決を試みているんだよね。[1] https://github.com/teorth/erdosproblems

それがまさにエルデシュの問題なんだよ。この投稿はそのうちの一つが解決されたことについてなんだ。

エルデシュの問題の中には、後に開発された高度な技術を使うと基本的にトリビアルなものもあるよ。ある教授が、エルデシュの共著者なんだけど、クイズの後に「しばらく解決されなかったエルデシュの問題を学生にクイズとして出せたのが誇らしい」って自慢してたのを覚えてる。

Hacker Newsで議論の続きを見る