世界を動かす技術を、日本語で。

Wolfram技術をLLMシステムの基盤ツールとして利用可能にする

概要

  • LLM は多用途だが 精密な計算 は苦手
  • Wolfram Language はLLMの弱点を補う 基盤ツール
  • Computation-augmented generation (CAG) でLLMを強化
  • APIやサービス で簡単に統合可能
  • 今後の AI開発の重要な方向性

Foundation Modelsに必要な基盤ツール

  • LLM は多様なタスクに対応し、人間らしい応答が可能
  • しかし 精密な計算深い知識 には限界
  • Wolfram Language は40年以上かけて開発された 計算基盤ツール
  • あらゆる分野の アルゴリズム・データ・手法 を統合
  • 科学・技術など幅広い領域で活用実績
  • AIやLLM もこの技術の恩恵を受けられるように進化
  • LLMと基盤ツールの組み合わせで より強力なAI が実現
  • Wolfram Language はAIが計算的に「思考」し「推論」するための 最適な媒体
  • 他システムやサービスとの 統合ハブ 機能も提供

LLMと基盤ツール統合の現状

  • 2023年1月、 Wolfram|AlphaChatGPT の連携案を発表
  • 2ヶ月後に ChatGPT用Wolframプラグイン をリリース
  • 当初はLLMのエコシステムが未成熟で、本格的な統合は困難
  • LLMが 深い計算や正確な結果 を自力で出せるかは疑問
  • 3年を経て、LLMの コア能力と限界 が明確化
  • LLMの価値向上 は他ツールとの連携にかかっているという認識が広がる
  • LLMと基盤ツールの統合 の重要性が増大

Computation-Augmented Generation (CAG) の導入

  • CAG はLLMの生成プロセスに リアルタイムで計算能力 を注入
  • 従来の RAG (Retrieval-Augmented Generation)は既存文書から情報を抽出
  • CAG は無限に計算で生成可能な情報をLLMに提供
  • CAG技術 は複雑だが、既存LLMシステムへ簡単に統合可能
  • 本日より CAG対応サービス を正式リリース
  • すべてのLLMシステムが Wolfram Foundation Tool を利用可能に

基盤ツールへのアクセス方法

  • MCP Service

    • MCP対応LLMシステム から即時呼び出し可能
    • Web APIとローカルWolfram Engine版を用意
  • Agent One API

    • LLM基盤モデルWolfram Foundation Tool を組み合わせた「ユニバーサルエージェント」
    • 既存のLLM APIの代替として簡単導入
  • CAG Component APIs

    • LLMシステム向けに きめ細かい統合 が可能なAPI
    • クラウド/オンプレミス 両対応
  • 詳細な機能リストや連携方法 は公式サイトやパートナーシップ窓口で案内

今後の展望

  • LLMと基盤ツールの緊密な統合 がAIの進化を加速
  • CAG は現時点で最も実用的なアプローチ
  • 今後も 新技術・新サービス の開発を継続
  • AIの計算力強化 が社会全体のイノベーションを推進

Hackerたちの意見

Mathematicaが好きで、よく使ってるんだけど、Claude Codeが使うツールとしてはPythonの方がいいと思う。Wolframで生成されたスクリプトは、どれもPythonより遅くて、答えも悪かった。Wolframの人たちは頑張ってるけど、今のところあんまり良い結果は出てないね。

それって、何が問題だと思う?

俺が使ってた頃、Mathematicaは積分を見つける能力がすごかったんだよね。Pythonはそこに追いついたの?

Sean CarrollのポッドキャストでStephen Wolframとの素晴らしいディスカッションがあったよ。聞いてみたら、Wolframに対する印象がすごく良くなった。彼は自由な発想を持つ、ちょっと変わった数学者であり科学者で、若い頃から真剣な仕事を始めたんだ。今でも若々しいクリエイティブなアプローチで思考や科学に取り組んでる。LLMが彼のツールとうまく組み合わさるといいな。

Stephen Wolframは、50年後にもまだ覚えられている数少ない知識人の一人になると思う。

彼はYouTubeでWolfram Alphaの(内部の)製品会議をライブストリーミングしてるよ。見るのがすごく面白い。何年も壁の花みたいに見てる。

他の人の検索を省くために、Wolframとのポッドキャストを紹介するね。『Stephen Wolfram on Computation, Hypergraphs, and Fundamental Physics』 - https://podbay.fm/p/sean-carrolls-mindscape-science-society-... (2時間40分)彼の仕事と人柄が好きなんだ。熱狂的なファンではないけど、彼は今活躍している歴史的に重要なコンピュータ科学者や哲学者の一人だと思う。たまに傲慢なところは目をつぶれるし、数十年にわたって真実と知識を追求している本物の独創的な思考者だって認めてるよ。

彼はずっとAIの世界にいるね。2009年頃のWolfram Alphaのアイデアは、自然言語をアルゴリズムに変換することだった。2016年にAI倫理に関するパネルで彼にニューヨークでちょっと会ったけど、彼は本当に鋭い人だよ。

LLMの研究エージェントのツールとしてWolfram Alphaを使ってみたけど、GoogleとPythonだけで解決できるタスクしか見つからなかった。

確かに、理論的にはどんな数学の問題も、チューリング完全なプログラミング言語で解けるよね。ここでのポイントは、特定の問題領域において、Mathematicaの方がPythonよりも効率的だったり、人間にとって理解しやすかったりするかもしれないってことだと思う。

Wolframが実際にPython+Googleを上回るのは、記号的なタスクだね。正確な代数の簡約、閉じた形の積分、形式的な冪級数、特定の領域での方程式の解決など。数値計算に関しては、確かにPythonが勝ってる。でも、x^2-1 = (x+1)(x-1)という保証が必要な場合、浮動小数点の近似ではなく、Wolframは別のカテゴリーに入る。問題は、LLMがそのようなケースにどれだけ頻繁に直面するかで、そのオーバーヘッドを正当化できるかどうかだね。

明らかにここでの使い道は深い数学的研究だね。LLMが高次の概念に焦点を当てて推論できるから。例えば、問題の一部を多項式の選択肢に還元できるなら、どの選択肢が実数解を持つかを瞬時に「知っている」ことが役立つ。Pythonの構文やGoogleの結果でコンテキストウィンドウを汚す必要はないからね。

MapleやWolfram、Matlabのような商用ツールには、多くの強力で高速なアルゴリズムが実装されていて、そこには価値があるよね。ただ、もちろんそういう仕事には報酬が必要だと思うけど、一般の人々からそれを隠すのは科学の精神に反すると思う。AIツールを使って、sympyやsage、macaulayのようなオープンソースの代替品を普及させるのは良いサービスになると思う。実際、クールなアルゴリズムがたくさん欠けてるし(特に計算代数幾何学のアルゴリズムがいくつか思い浮かぶ)、一部のアルゴリズムは非常に難解だから、今日のコンピュータに最適な方法で実装されているわけじゃないことも多い。数学者のために、数学も理解している優秀なソフトウェアエンジニアが書いたより良いソフトウェアがあればいいなと思う。AIがここで活用されて、数学者にもっと最先端のツールを提供してくれることを期待してる。正直、形式化がもたらす価値よりもずっと大きいと思う。

科学の精神に反する 残念ながら、銀行は科学の精神のドルを受け取らないし、私の近くのレストランもそうだよ。

科学の精神に反して一般の人々からそれを隠すのは良くないよね。科学の中では、参加者は常に方法論や結果の説明を公開して、レビューや再現ができるようにしてきたんだ。でも、同じ科学の中で、誰もが自由にラボにアクセスできるわけじゃない。ラボの作り方や何をするかの設計図は手に入るけど、建物自体はもらえないってこと。同じことが計算にも言えるよ。これらのスイートに含まれるほとんどの(いや、全ての)アルゴリズムはどこかに文書化されていて、実装したいならできるはず。知識に制限はないんだ。ただ、実装はタダでは手に入らないってことだね。

MathematicaやMapleのようなコンピュータ代数は、形式的に厳密ではないんだ。関数の定義域を混同したり、「多値関数」のための分岐点の選択など、正しい結果を得るために必要な仮定が隠されていたり確認されていなかったりするから、間違った結果が出ることがある。包括的に説明された「強力で高速なアルゴリズム」を提供する作業は、正確性を確保するための基礎数学の証明システムを構築する一環として行われるべきだと思う。

ブログ記事は、具体的に何を解決するのか、デモ、あるいはこれまでの統合で何を解決したのかのエピソードがあればもっと効果的だったと思う。今のままだと、ちょっと自己陶酔的で、必死な感じがする。Wolframの技術が relevancy を維持するのが脅かされていると感じているみたいだね。

ここでの本当の価値提案は、LLMが根本的に提供できない正確性の保証だね。LLMが「2+2=4」と言うとき、それは統計的に到達したものであって、計算的に到達したわけじゃない。安全が重要なもの、例えば工学的な許容差、薬の投与量計算、金融モデリングなどでは、答えを出すために決定論的なエンジンが必要で、LLMは人間の意図と形式的なクエリの間を翻訳する役割を果たすべきだ。CAGの枠組みは巧妙なマーケティングだけど、根本的なアイデアはしっかりしてる:LLMを計算自体ではなく、計算カーネルへの自然言語インターフェースとして扱うべきだ。私たちはエージェントパイプラインからPythonのサブプロセス呼び出しを使って似たようなことをやっていて、うまくいってる。問題は、Wolfram言語がPython+scipy+sympyを上回るだけの価値を提供して、ライセンス費用やエコシステムのロックインを正当化できるかどうかだね。

コードを使って質問に答えるLLMは新しいことじゃないよ。「苺にRがいくつある?」って質問がもう彼らを困らせないのは、そのためだ。Pythonの数行を書いてそれを実行して答えを返せるからね。Mathematica / Wolfram Languageをこの基盤にするのは悪くない(遅すぎるとも言えるけど)、理論的には非常に統合されたシステムだから、かなりの一貫性があるはず。うまくいくと思う。ただ、サンドボックス用に設計されてるのかな?この「CAG」の核心的な要件はサンドボックスの要件だから。Pythonはそれにはあまり向いてないけど、多くの人が長年かけて努力したおかげで可能にはなってる。Wolfram Languageも同じレベルを持ってるのかな?商用だから不利な点があって、サンドボックス技術はWolfram Researchが開発しなきゃいけないから、コミュニティではなくて。

サンドボックス化が重要だと思う。だから、WebAssemblyを使って完全にサンドボックスで動作するWolfram Languageのインタープリタに取り組んでるよ。https://github.com/ad-si/Woxi

「コードを使って質問に答えるLLMは新しいことじゃない。だから「イチゴにRがいくつあるか」って質問はもう彼らを困らせない。Pythonの数行を書いて、それを実行して答えを返せるから。」これは間違い。ツールの使い方とは関係なく、ただの推論だよ。

同意だけど、真に基盤となるためにはオープンソースで、誰でもアクセスできる必要があるよね!だから、オープンソースのMathematicaの実装(つまりWolfram Languageのインタープリタ)に取り組んでるんだ。https://github.com/ad-si/Woxi

Mathematicaの価値の大部分は言語よりも標準ライブラリにあるんじゃない?

現在の主要な技術革新は、すぐにオープンソースのクローンが生まれて、商業製品と同等に進化するのが普通だよね。なんでWolfram AlphaやMathematicaにはそれが起こらないんだろう?Sympyは知ってるけど、Mathematicaには全然及ばないし、比較にもならないよね。ツールの数学的な性質がオープンソースコミュニティにとって克服できない障害になってるのかな?

SageMath?使ったことはないけど、代替案として名前は聞いたことあるよ。(グーグルで検索したら、これが2番目に出てきた;https://github.com/Mathics3/mathics-core)

いい質問だね。Wolfram Alphaに長い間魅了されてきた者として(クローンを考えたことがあるかもしれないけど)、成長する中で、現実の世界でMathematicaはあまり…役に立たないことに気づいたんだ。もしかしたら何か見落としてるのかも。でも、特定の数学研究以外で誰も本当に使ってないみたい。最初からそのエコシステム内で育ったものだしね。基本的な問題の一つは、コア言語が現代のCPUではあまりパフォーマンスが良くないことだと思う。だから、実用的なアプリケーションには最適なツールじゃないかも。再度言うけど、もしかしたら何か見落としてるのかも?

https://mathics.org/

https://github.com/ad-si/Woxi

Wolfram / Mathematicaのホビーライセンスを買おうとするたびに、商品の提供が人生で見た中で一番複雑だから諦めちゃう。なんで、ちょっとした価格を払ってWolfram One Cloud + APIコール + LLMアシスタント + この新しいMCPアクセス + Mathematicaの全部を手に入れられないの?5つの異なるものを買わなきゃいけないなんて、ユーザーとしてはどう見えるの?5つの異なるバイナリが必要ってこと?本当にこれを整理すべきだと思う。これでお金を失っているのは分かるから。サポートにメールしたことがあるけど、逆にもっと混乱しちゃった。

Wolframが優れていると感じる印象をもとにした悪いジョークだけど…もしそれを買う方法を理解できないなら、たぶんあまり使うこともないだろうね。