世界を動かす技術を、日本語で。

クヌースの「クロードサイクル」問題に関するさらなる人間とAI、証明助手の研究

概要

Knuth Claude's Cycles問題LLM によって 完全解決 2026年3月解決報告 Hacker Newsで 関連議論 が活発 Claude's Cycles論文 への注目 AI技術の進展 による新時代の到来

Knuth Claude's Cycles問題の完全解決

  • Knuth Claude's Cycles問題、長年未解決だった数学的課題
  • 2026年3月大規模言語モデル(LLM) が解決を達成
  • Hacker News で速報的に報告、2件の短いコメント
  • 解決の詳細は ChatGPT共有リンク で公開
  • Claude's Cycles論文(PDF) もHacker Newsで話題に

解決の意義と反響

  • 362件 のコメントが寄せられ、技術者・研究者の間で大きな反響
  • AIによる数学的難問の解決 が現実となった瞬間
  • LLM の応用範囲拡大、数学・理論計算機科学への貢献
  • KnuthClaude など著名研究者の名を冠した問題の解決
  • 今後の AI研究教育分野 への波及効果

LLMによる問題解決の流れ

  • ClaudeChatGPT などの 先進的LLM が解析を実施
  • 膨大なデータと論理推論能力を活用
  • 証明過程解法 がオンラインで共有・検証
  • 専門家コミュニティで 透明性再現性 を確保

今後の展望

  • AIと数学 の連携強化、未解決問題への挑戦加速
  • LLM による新たな発見や証明の期待
  • 教育・研究現場 でのAI活用事例の増加
  • Hacker News などコミュニティによる知識共有の重要性

Hackerたちの意見

興味本位で聞きたいんだけど、みんなはP≠NPに挑戦してるのかな?

「新しい大学院生が、我々が出した組合せ論の問題に進展を見せた!」 「おお、すごい!彼がP≠NPを解けるか見てみよう!」

前から言ってるけど、AIはマクドナルドをうまく管理する前にフィールズ賞を取ると思う。数学が難しく感じるのは、脳(ハンマー)でネジ(数学)をねじ込もうとしてるからなんだよね。LLMは深さが浅くて幅が広い状況で新しい数学をたくさん発見してる。未来には、LLMを捨ててAlphaGoスタイルの強化学習をLean構文木でやるようになると思う。そっちの方が、もっと大きなスケールで考えられるはず。プロの数学者なら、彼らの武器は大体10個のトリックだって言うよ。そのトリックを潜在ベクトルとしてコード化できれば、もう勝ち確だね。

これは主に既存の法律についての話で、技術のことじゃないと思う。給料がかかってない限り、ランダムなマネージャーの指示に従うことはないだろうね。もし給料がAIロボットの指示に従うことに依存してたら、世界はすぐに怖い感じになりそう。

トリックってのは、我々が簡略化する論理式のパターンに過ぎない。つまり、これは脳内の潜在ベクトルなんだ。代数幾何学を使って数論の問題を解くために、幾何学のアナロジーを使うんだよね。Lean構文木で訓練されたAIは、我々の直感を正しく含むような独自の変な直感を発展させるかもしれない。これが突飛に聞こえるなら、チェスを見てみて。StockFishの機械的解釈について掘り下げた人がいるか気になる。

AIはマクドナルドをうまく管理する前にフィールズ賞を取る もちろんだよ、マクドナルドを管理するにはマルチモーダルな知能が必要だからね。つまり、人間の知能が必要なんだ。 > 未来には、LLMを捨ててAlphaGoスタイルの強化学習に移行すると思う コーディングも同じだね。ただ、LLMは他のAIとのインターフェースとして使われるかもしれないけど。

そんなこと言ってるの見たことないよ。

俺はずっと言ってるけど、AIはマクドナルドの管理ができるようになる前にフィールズ賞を取ると思う。これが好きで、もう一つ言いたいことがあるんだけど、最後に自動化される仕事はQAだと思う。この技術の波は、今まで以上に知識労働の種類についての議論を引き起こしてるし、俺たちはそれによってより鋭くなると思う。

実際に新しい数学を生み出してるの?最近のACMの号には、数学者たちがプライベートに作った数学ベンチに対してAIをテストした記事があったんだけど、彼らが見つけたのは、AIがいくつかの問題を解けるとしても、数学で本当に新しくて独創的なものを生み出すことはないってこと。既存の研究の間に繋がりを見出して、ちょっとひねりを加えるのが得意なだけなんだ。

プロの数学者として言わせてもらうと、良い証明には問題の非常に良い表現が必要で、その後にトリックを引き出すんだ。後者はLLMを使って簡単にできるけど、前者はまだ人間が必要なんだ。それで全然構わないよ。

まだまだ専門の人間の入力とインタラクションに大きく依存するだろうね。クヌースは専門家で、どう導くかを知ってる。

現時点では、ミレニアム賞問題を解決したモデルはまだないね。[1] 1. https://mppbench.com/

面白いけど、驚きはないな。専門家がモデルを導くと、たぶん解決策にたどり着くと思う。モデルは専門家のための怠けた仕事には向いてるけど、難しい質問や複雑な問題には盲点が多いことがある。

若い頃、私にとっての境界線は「トロールがトロールをトロールする」という4chanの格言を学んで、すべてのインターネットのやり取りに懐疑的に接するようになったことだった。しばらくの間、Redditが「死んだインターネット」になってしまったのは確信してる。このスレッドは私にとってまた別の瞬間で、誰がボットで誰が誠実な意図を持っているのか、もうわからなくなってしまった。

https://xcancel.com/BoWang87/status/2037648937453232504

返信の中に明らかにAIっぽいのが多い。「それはXじゃなくてYだよ。」

いろんなことと同じように、AI数学の進化は90年代の偉大なSF作家グレッグ・イーガンが示唆した軌道に沿って進むと思う。数学の本質は変わらないけど、その理由は確実に変わる。イーガンは「数学の発見」が未来のAI文明で「機械的な数学の発見」として社会にモデル化される未来を想像していて、それは塩鉱のような環境で、好きなだけ掘って新しい発見をすることができるというもの。発見されたもの自体は、鉱山の外では知識としての価値がないかもしれないけど、数学的な対象としては「純粋な価値」を持ってる。ある人たちはその発見自体に価値を見出していたけど、他の人たちはたまに広く受け入れられる発見があることを認識していた。テレンス・タオが設立したような研究所は、この未来にほぼ完璧に合致すると思うけど、短期的にはこの研究分野が現在のAIシステムを進化させるための有用な方法をたくさん提供するのはほぼ確実だと思う。今のシステムは、何か新しい情報を「正確に」生成できる状態にあるからね。今の定理証明エンジンは、まだ手動でキュレーションされているトレーニングループの重要な部分なんだ。

ラマヌジャンはこの状況の良いアナロジーだね。理論は証明が出るまで正しいか間違っているか分からない。AIが生み出すものも同じだよ。いつも「言ったでしょ」っていうのが含まれてる。

論文の中で、彼らのシステムプロンプトの一部が紹介されてるね。 > * 毎回の exploreXX.py 実行後は、他のことをする前にこのファイル [plan.md] をすぐに更新すること。 * 例外なし。前の探索がここに記録されるまで、次の探索を始めてはいけない。 これって、高度な問題解決のパフォーマンスを向上させることが知られてるの?もしそうなら、なんでこの特定のプロンプトなんだろう?