世界を動かす技術を、日本語で。

深層学習は応用トポロジーである

概要

  • 本記事は AIとトポロジー の関係性を解説します。
  • トポロジー は「形の変形に不変な性質」を扱う数学分野です。
  • ニューラルネットワーク はデータを高次元空間で分離・分類するため、トポロジー的変形を活用します。
  • 埋め込みベクトル を用いて、あらゆる情報を高次元空間上の点として表現します。
  • AIの進化 は「推論マニフォールド」を歩む過程として捉えられます。

AIとトポロジー:ニューラルネットワークにおける形の科学

トポロジーの基本と直感的理解

  • トポロジー とは、「表面や空間の形状の変形に対して不変な性質」を研究する数学分野であることを確認。
  • 粘土のような素材を 曲げたり伸ばしたり しても、破ったり穴を開けない限り、特定の性質(例:円の数)は変わらないという直感的説明をすること。
  • 円を描いた粘土を変形しても、 円が直線や二重円、自己交差する形にはならない ことに着目すること。

トポロジーとデータサイエンスの関係

  • データ分類問題では、 2次元平面上で線引きによる分離が難しい場合 が多いことを確認。
  • トポロジー的変形(曲げ、ねじり、伸縮)をデータ空間に適用し、 分離可能な形に変換すること が重要であることを提案。
  • ニューラルネットワークの本質は、 線形代数による空間変換の積み重ね であり、各層が表面の変形を担うことを理解すること。

ニューラルネットワーク層のトポロジー的解釈

  • tanh層(tanh(Wx+b))は、 重み行列Wによる線形変換ベクトルbによる平行移動tanh関数による非線形変形 で構成されることを確認。
  • 各変換は連続的な空間変形として可視化でき、 複雑なデータ構造の分離 を可能にすることを説明。

高次元空間への拡張

  • 2次元では分離不可能なデータ(例:円の中と外)も、 3次元へ拡張することで分離可能 となることを確認。
  • ニューラルネットワークは 任意の高次元空間 でデータを扱い、 複雑な分類や推論 を実現することを強調。

ニューラルネットワークはトポロジー生成器

  • ニューラルネットワークは、 損失関数によって定義された性質を持つトポロジー をデータ上に生成することを提案。
  • 例として、画像分類なら「犬」と「猫」を異なる領域に分ける表面を学習し、 翻訳タスクや次トークン予測タスクにも同様のトポロジー生成 が適用されることを説明。

マニフォールド(多様体)としてのデータ表現

  • 色空間や画像空間など、 あらゆるデータは高次元マニフォールド上の点として表現可能 であることを確認。
  • ニューラルネットワークは、 画像やテキストなどの情報を埋め込みベクトル として内部表現し、 数学的操作が可能 となることを強調。
  • 例:「king」-「man」+「woman」=「queen」という 意味的演算 が可能であることを紹介。

あらゆるものはマニフォールド上に存在

  • 家具のサイズ・形状、気象条件、感情と匂いの関係など、 全ての概念や情報は何らかのマニフォールド上に配置可能 であることを強調。
  • ニューラルネットワークは 普遍的なトポロジー発見器 として機能することを説明。

推論マニフォールドとAIの進化

  • 推論自体も 良い推論と悪い推論が分離されたマニフォールド上 に存在すると仮定すること。
  • Instruction TuningやRLHF(報酬付き人間フィードバック)は、 次単語予測空間から推論空間への遷移 を実現する技術であることを説明。
  • Chain of Thought(思考連鎖)ファインチューニングは、 AIの推論能力向上の鍵 であることを強調。

推論トレースの選別とAIの限界

  • LLM(大規模言語モデル)の思考過程(reasoning trace)を大量に収集し、 良い推論例のみで再学習すること による性能向上手法を紹介。
  • 「良い推論」の選別が限界となり、 AGI(汎用人工知能)には到達できてもASI(超知能)には至らない可能性 を指摘。
  • 高品質な推論トレースの収集コストが高い点も 現実的な制約 として言及。

このように、ニューラルネットワークとトポロジーの関係を理解することで、 AIの本質的な仕組みや可能性、限界 について新たな視点を得ることができる。

Hackerたちの意見

トポロジーの話なら、類似検索のために多様体を歪めるなんてことはしないよね。いや、これは幾何学の話で、メトリックがあるんだ。現実と同じように、物事を比較できるようにしたいんだ。多様体のトポロジー変換はトレーニング中にも起こるよね。それを考えると、トレーニング中にトポロジーはどう進化するのか気になる。最初は激しく変わってから安定して、次に幾何学的な洗練が進むんじゃないかな。関連する論文をいくつか紹介するね: * 深層学習におけるデータ多様体のトポロジーと幾何学 (https://arxiv.org/abs/2204.08624) * 深層ニューラルネットワークのトポロジー (https://jmlr.org/papers/v21/20-345.html) * 大規模言語モデルにおける持続的トポロジー特徴 (https://arxiv.org/abs/2410.11042) * リッチフローとしての深層学習 (https://www.nature.com/articles/s41598-024-74045-9)

同意する、むしろ応用線形代数って感じだね…でもそれだとちょっと魅力に欠ける。

マニフォールドのトポロジー変換は、トレーニング中にも起こります。それを考えると、トレーニング中にトポロジーはどのように進化するのか気になりますよね?もしGANやVAEを使ったことがあるなら、この質問に答えられるかもしれません!答えは「はい」に近いです。トレーニング中のさまざまなチェックポイントでGANを見て、高次元空間の異なる点がどのように動くかを確認できます(UMAPやTSNEのようなツールを使って)。> 最初は激しく変化してから安定し、次に幾何学的に洗練されると想像します。それも正しいですが、最初の激しい変化は学習率やオプティマイザーの選択にも影響されます。

データは実際には多様体上に存在しないんだ。データを考えるための近似に過ぎない。深層学習で行われる有用なことのほとんど、100%ではないにしても、トポロジーを考えないことから来ている。深層学習は何かを応用するわけじゃなくて、主に試行錯誤によって進化してきた経験的な分野で、もちろん理論からのいくつかの直感もあるけど(それはトポロジーじゃない)。

自称実践者の間にあるこの理論に対する誇り高い反感が理解できない。既存の理論が不十分でも、運用理論が有益じゃないの?それとも、神秘的なものと推測&確認の苦労が職の安定につながってるの?

理論からのいくつかの直感(それはトポロジーじゃなかった)。これらの「直感」は事後的なもので、つまり深層学習が手法を考案した後に、他の科学分野の研究者が深層学習のアプローチと彼らの(おそらく数十年前の)手法の類似点に気づくってことだと思う。著者がGPTが実際には彼が以前物理で解決した同じ計算問題であることを発見する例があるよ: https://ondrejcertik.com/blog/2023/03/fastgpt-faster-than-py...

これには全く同意できない。確かに試行錯誤はたくさんあるけど、実際にはトポロジー、幾何学、ゲーム理論、微積分、統計学など、多くの数学の分野からの理論の融合なんだ。基礎(つまりバックプロパゲーション)は重みへの連鎖律の適用に過ぎない。違いは、深層学習が非常にアクセスしやすい(利益を生む)分野になったことで、多くの実践者が形式主義の起源を学ばずにこの分野を学ぶ贅沢を享受できるようになったことだ。最終的には、彼らが他の分野でずっと前から存在していた理論や技術を利用したり「再発明」したりすることができるようになっている。

これは錬金術だ。現在の形の深層学習は、錬金術が化学に関係するように、仮説的な基礎理論に関連している。数百年後、私たちの後の文明のイヌクティトゥット語を話す高校生たちは、この奇妙な言葉「深層学習」が昔の共通語の名残であることを学ぶだろう。

データは実際には多様体上に存在しない。多くの場合、存在するよ(そしてそれは「シーブ」と呼ばれる)。

これはディープラーニングに10年以上関わってきた人間として言うけど、これはかなり間違っている。データは明らかに多様体上に存在するし、ディープラーニングへの応用に関しても(私の投稿にリンクされている2014年のクリス・オラのブログを参照)間違っている。埋め込み空間は「空間」と呼ばれる理由がある。GANやVAE、コントラスト損失など、これらはすべて異なる種類のデータを生成するために「歩く」ことができるベクトル多様体を構築することに関するものだ。

近似誤差を考慮して定義を緩めればそうなるよ。例えば、Intrinsic Dimensionality Explains the Effectiveness of Language Model Fine-Tuning (https://aclanthology.org/2021.acl-long.568.pdf)

MLがなぜこんなにうまくいくのか良い説明がないっていうのは、みんなが自分の専門分野から自分なりの解釈を作り出す余地を与えてる気がする。特に頭の良い人たちからもそういうのを見たことがある。ハンマーしか持ってないなら...

Hacker Newsで議論の続きを見る