世界を動かす技術を、日本語で。

チョムスキーが語るChatGPTの利点 (2023)

概要

  • Noam Chomsky によるAIと人間知能の比較に関するインタビューの要約
  • AIの進歩 とその社会的・倫理的影響への懸念
  • Large Language Models(LLMs) の限界と科学的理解の不足
  • 人間と言語習得 の科学的プロセスの重要性
  • AI技術の有用性とリスク のバランスを問う内容

AIは人間より賢くなるのか

  • AI(人工知能) は1950年代から発展し、さまざまな分野で利用拡大
  • 人間の能力を超えるプログラム (例:チェス、計算機)は既に存在
  • 「能力」の定義 に注意が必要で、人間のパフォーマンスを基準とするならAIは上回る場合あり
  • 生物の認知能力 (例:砂漠のアリのナビゲーション)は人間以上の例も存在
  • AI製品 は有用性と同時に危険性も持ち合わせる

AI技術の応用と課題

  • LLMs(大規模言語モデル) やチャットボットは、誤情報や名誉毀損、誤解を生むツールにもなり得る
  • 画像・音声の合成技術 との組み合わせでリスク拡大
  • AI研究者による開発停止要請 も出るなど、社会的な懸念が高まる
  • 技術の利点とコスト を慎重に評価する必要性

AIと科学的理解の違い

  • AIの工学的アプローチ は「理解」より「製品化・応用」に重点
  • 本来のAI創始者 (Alan Turing, Herbert Simon, Marvin Minskyなど)は科学的理解を目指した
  • 現代のAI研究 では、科学的探求よりも実用面が重視される傾向
  • GOFAI(古典的AI) と呼ばれ、軽視されがちな過去の科学的アプローチ

言語習得とAIの本質的違い

  • 人間の言語習得 は少ないデータから豊かな知識を獲得
  • AI(LLMs)は大量データ で統計的規則性を模倣するが、言語の本質的理解はできない
  • LLMsは不可能な言語にも対応 できてしまうため、言語獲得の科学的説明にはならない
  • 科学では「可能な言語」と「不可能な言語」の区別 が重要

科学的アプローチの意義

  • 言語獲得は生物学的素養 (faculty of language)が前提
  • 成長・発達の過程 として、外部データが内的システムを部分的に形成
  • すべての人間に共通する種特有の属性 としての言語能力
  • 知識の所有(competence)と使用(performance)の区別 が重要
  • 内的システム によって無限の表現が可能となる

AI技術の社会的・倫理的側面

  • AI技術の進歩 は社会に利益とリスクをもたらす
  • ディスインフォメーションや倫理的課題 への対策が不可欠
  • 技術の発展と規制のバランス が今後の課題

このインタビューを通じ、Chomskyは AIの進歩 が人間の知能や言語獲得の科学的本質に迫るものではなく、 社会的・倫理的課題 への警鐘を鳴らしていることが明らかとなった。

Hackerたちの意見

(2023)

そうだね、2年で色々あったよね。

聞いたところによると、チョムスキーは脳卒中を患って言語に影響が出たみたい。残念ながら、最近の彼の意見は聞けないだろうね。

3.35時間のチョムスキーインタビュー、MLストリートトーク https://youtu.be/axuGfh4UR9Q

チョムスキーはその最後の1時間にいるよ。その部分は異常に良いね、実際にエレガントだよ。

彼が「人間が頂点にいる大いなる存在の連鎖はない」と主張しているのは面白いけど、LLMが赤ちゃんが学べない「不可能な言語」を学べるから、言語について何も教えてくれないって言うのはどうなんだろう。これは人間中心的な主張じゃない?言語が人間の認知によって本質的に定義されているって言ってるようなもんだよね。

チョムスキーが「言語」と言うときは、「自然言語/人間の言語」を指していて、例えば /[ab]*/ や素数のことじゃないんだよね。

そうだね、人間の言語を学ぶっていうのは、実際には人間がやることによって定義されてるんだよね。彼が指摘してるように、もしその記事が理解できるなら、昆虫のナビゲーションを学ぶのも、昆虫がやることによって定義されてるわけで、人間がデザインしたナビゲーションシステムではないんだ。

なんか変な感じだった。AIが人間を超えるかって質問されたら、科学哲学について長々と語り始めて、自分の研究の重要性を守ろうとしているように見えたし、最後にはポストモダニズムについての文化戦争的なコメントまでしてた。

チョムスキーが自分の専門的権威を振りかざして、フィールドの中心に居続けるために rant している話がたくさんあるよね。

「裏庭の砂漠アリは小さな脳を持っているけど、原理的には人間のナビゲーション能力をはるかに超えている。人間が頂点にいる大いなる存在の連鎖はない。」この引用を聞いて、アドリアン・チャイコフスキーの『時間の子供たち』に出てくるクモの種の全然違う技術発展の道を思い出した。彼らはフェロモンを使ってアリの種をプログラムして計算をさせてたんだよね。

彼が何を言ってるのか全然わからない。人間は明らかに蟻よりもナビゲーションで優れてるよ。特に、地形に自由にマークを付けられるならね。なんか「言葉にできない性質」とかいうおかしなこと言ってるみたい。

コンピュータが「理解」できるように言語を翻訳する方法を見つけたっていうのは、言語学者にとってワクワクすることだと思うよ。単語(トークン)を取って、その「意味」を1,000次元のベクトルに抽象化するって、言語学の分野を革命するようなことだよね。すべての言語の基盤にあるパターンを分析して理解するための新しいツールができたんだ! しかも、この方法が機能するっていうのは否定しがたい事実だよ。コンピュータに指示を出すと、それを「理解」してくれるのは、LLMが登場する前には不可能だったことなんだ。今の主な議論は、「理解」みたいな言葉の意味や、LLMが人間と同じように意識を持っているかどうか(持ってないけど)についてだね。

言語学に限定すると、LLMの理解不足っていうのは関係ないと思う。もしLLMが人間の言語を解析する能力を持っているかどうかが問題なら、答えは明らかに「はい」だよ。実際、人間の言語だけじゃなくて、マルチモーダリティで見られるように、同じトランスフォーマーアーキテクチャが構造を持つものをモデル化して生成するのにうまく機能してるんだ。彼がそのエッセイで「普遍文法」を一度も言及しないのが驚きだよ。もしかしたら、人間には本能的に「普遍文法」が組み込まれてるのかもしれないけど、それが解析するために必要だとは明らかに言えないね。明示的な言語ルールや生成構造を設定する必要はないし、十分なデータがあればモデルはそれを生成することを学ぶんだ。誰かが学習した表現から明示的な生成ルールを抽出できるか試したことがあるのかな?「普遍文法」仮説は実際には反証不可能だから、せいぜいプラトン的な表現仮説に同型の一般化された同等物を期待することができるし、すべての人間の言語がある潜在的な表現に沿っていると主張できるんだ。私たちの脳はこのサブスペースで機能するように最適化されているってね。それは少なくともテスト可能な仮定だと思う。LLMが学習した空間の幾何学を逆に工学的に解析しようとすることで。

LLMが人間と同じように意識を持っているかどうか その問題は…人間が意識せずにやっている「賢い」活動がたくさんあるってことだよ。 - 歩いたり、自転車に乗ったり、キーボードを打ったりするのは、各筋肉の動きを意識的に計画することなく流れるように行われる。 - 誰かの文を終わらせたり、文法的に間違っている文を見抜いたりすることも、ルールを説明できないことが多い。 - 部屋に入ると、脳は顔や家具、物をすぐに認識するけど、「あれはテーブルだ」とか「ジョンだ」とか意識的に考えることはない。

残念ながら、あなたは哲学で最も難しい問題(意識)について大雑把な主張をしてしまったことで、自分のポイントを弱めてしまったね。私は実際、LLMが意識を持っていないとは言えないんだ。彼らが非常に異質な方法で意識を持っている可能性は十分あると思う。これは人々にとって非常に奇妙で、潜在的に恐ろしい主張だと理解しているけど、意識がどれほど奇妙で恐ろしいものかを理解してほしい。

コンピュータが「理解」できるように言語を翻訳する方法を見つけたっていうのは、言語学者にとってワクワクすることだと思う。 彼らは本当に興奮してると思うよ。これらの機械を使っている言語学者が不足しているわけではないみたい。でも、言語を理解する能力と翻訳する能力を区別することが重要だと思う。あなた自身が「理解」にクォートを付けているくらいだからね。これは多くの翻訳者にとって、文脈がわからないために正しく翻訳できないことがあるから、しばしば挑戦になる。私たちのコミュニケーションは、話したり書いたりする言葉以上に深いものなんだ。これが言語学の大部分であり、この深さが重要なんだ。(少なくとも、私はそう言われたけど、私は言語学者じゃないからね)これはチョムスキーが言おうとしている区別のようだ。 > 今の主な議論は、「理解」みたいな言葉の意味や、LLMが人間と同じように意識を持っているかどうか(持ってないけど)についてだね。 その通り。ここでは、私はチョムスキーの側にいて、あまり議論の余地はないと思う。私たちは、根本的な因果関係を誤解しながらも、正確な予測を行う長い歴史がある。私のバックグラウンドは物理学で、コンピュータサイエンスに移った(両方の学位を持ってる)、MLに取り組んでる。私は、ヒントンやサッツケバーのようなトップの仲間たちが、ばかげた主張をしているのを見ている。私はそれをばかげていると言うよ、なぜならそれは物理学の分野で私たちが何度も犯してきた間違いだから。何度も学ぶ教訓の一つで、間違いを犯すのがとても簡単なんだ。ヒントンとサッツケバーは、これはバグではなく機能だと言っている。でも、データにフィットするだけでは不十分だってことは知っている。データにフィットすることは、正確でテスト可能な予測をすることを可能にする。でも、根本的な因果構造をモデル化するには不十分なんだ。科学は、間違ったモデルで正確な予測を示す長い歴史がある。単に「間違いの相対性」のようなことだけじゃなくて、もっと直接的に。地心モデルがまだ良い予測をするために使われたことを忘れたのか?コペルニクスは宗教的権威からだけでなく、学者たちからも抵抗に直面した。ガリレオやボルツマン、アインシュタインなども同じだ。人々は彼らの主張を不合理だから拒絶したわけじゃない。彼らの主張には十分な理由があったから拒絶されたんだ。ただ…それが彼らを正しいとは言えなかっただけ。

あの1000次元のベクトル、ワードエンベディングは新しいものじゃないよ。君のコメントの他の部分にはコメントしないけど、そのLLMの側面は「古い」技術だよ。word2vecは11年前に発表されたしね。

「私たちが言語をコンピュータが『理解』できるものに翻訳する方法を見つけたという事実は、言語学者をワクワクさせるべきだ。」いや、全然理解なんてしてないよ。コーディファイと理解や翻訳を混同しないでほしい。LLMは入力を理解してるわけじゃなくて、単に訓練された方法に基づいてそれに対処してるだけ。「そして、ここには非常に反論が難しい事実がある。この方法は機能する。コンピュータに指示を出すと、それを『理解』する。」いや、本当にその指示を理解してるわけじゃない。せいぜい「イディオットサバン」と呼ばれていたものだよ。考えてみて、そんな風に他人を表現してた人たちがいたけど、誰がイディオットなの?お気に入りのLLMにあまり使われていない言語でプログラムを書かせてみて。例えばVMwareのPowerCLI(人気のあるPowerShellだよ)で何か役立つことをさせてみよう。できないから、出力するのは何かしらだけど。PowerCLIはStackoverflowとかではあまり見かけないけど、PSベースだからLLMは新しいスーパーワイルドでハイなヒッピーみたいに妄想するだろうね。

チョムスキーのアイデアに対するコメントの知的関与のレベルが驚くほど低いね。私たちはこの二つの考えを持つことができるはずだよ。一つは、LLMの能力が素晴らしくて役に立つこと、もう一つは、今世紀のAIの大きなブレークスルーが、少なくとも今のところ、私たち自身の知性やその構成についての理解を深めていないこと。これは変わるかもしれない、特にLLMの知性が私たちの知性と深い意味で類似していることが証明されれば—これはまだ決まっていないポイントだね。しかし、もし類似点があるなら、知識の可能性もある。私たちはLLMの完全な機械的理解を持っていて、その構造を分解することができるけど、脳についてはまだできていない。世界で最も賢い人たちが、LLMをより小さく、より効率的にするために取り組んでいる。ミニチュア化の推進が、盲目的な時計職人によって発見されたトリックを再発見する可能性もあると思う。でも、これらのことは当然ではないよ。

この10年のAIは、少なくとも今のところ、私たち自身の知能やその構成についての理解を深めてはいない。 これには少し反論したいな。確かに自分たちの知能を理解する助けにはなってないけど、逆にそんなものが本当に存在するのか疑問に思わせられた。物理学のように、人間が考えたり決定したりする方法を説明できるシンプルで美しい自然法則はないのかもしれない。CNNが直感的に理解できる階層的な抽象化を通じて顔を認識することを学んだとき、人間がやっていることとの類似性を否定するのは難しい。もしかしたら、すべては進化した混沌とした基盤の出現的特性に過ぎないのかも。ここ10年のAI開発からの大きな教訓は「人間って本当に特別じゃないんだな」ってこと。これは物理学で経験したこととも似てる。理論はしばしば人間の観察者に特別な重要性を与える間違いを犯し、それが後に理論が一般化できない原因だとわかったりするんだよね。

LLMの能力は素晴らしくて役に立つ。 彼がこれに反対しているとは思えなかった。君が言ってたのはこの部分だと思うけど、彼が第二の考えを持っているのは明らかだよ。| 人間の能力を超えるプログラムが開発される可能性は高いのか?「能力」という言葉には注意が必要だね、理由は後で説明するけど。もしこの言葉を人間のパフォーマンスを指すものと考えるなら、答えは「確実にそうだ」だよ。LLMが素晴らしくて役に立たないとは言えないと思う。| 純粋なエンジニアリングと科学の間に大まかな区別をつけられるよ。明確な境界はないけど、これは有用な初歩的な近似だね。純粋なエンジニアリングは、何らかの役に立つ製品を生み出そうとする。科学は理解を求める。これが彼の会話の核心のようだね。彼はエンジニアリングではなく科学の側面について話している。

今のところ、今十年のAIの大きなブレイクスルーは、私たち自身の知性やその構成についての理解を深めてはいない。人々の幻想や、自分の権威やコントロールを犠牲にして、最小の努力で最大の成果を得ようとする姿勢(自動回帰モデルで得られるものに似てる!)は、私には驚くべき洞察だった。

LLMの知性が私たちの知性と深い意味で類似していることが証明されたら、まずはLLMに「知性」を実装しないといけないね。それから比較できる。/s

学者たちが最近のサブシンボリックアプローチのブレイクスルーを、知性について学ぶためのモデルとして軽視しているのが本当に不思議だよね。まるで生化学者が人間の脳を見て、「ここには知性が全くない、ただの電気化学反応がたくさんある」と結論づけているかのようだ。出現の可能性を完全に無視している。誤解しないでほしいけど、「AGIは到達した」とは言ってないよ。ただ、現在のLLMでも人間の言語の発展や科学の進化に対して興味深い教訓があると思う。これらのモデルにおける転移学習の成功は、普遍的な言語能力に関する議論に何を貢献できるのか?LLMシステムと人間の間で相関する不変量はどうなっているのか?

これまでのところ、私たち自身の知性についての理解が大きく深まったわけではない。科学は進歩するけど、目の前でそれが起こっているのを見ると、あまり重要に思えないことが多いんだよね。新しい発見の影響を理解することが少ないから。ここ数年で、知性の背後にある言語の役割が重要だってことがわかったし、概念同士の距離を定量的に表現する方法も見つけた。最近では、新しい推論AIモデルから、人間の推論にも当てはまる直感に反することがわかったんだ。間違ったり不完全な推論でも、正しい結論に達することがよくあるってこと。

もしかしたら文脈を見逃してるかもしれないけど、彼は「LLMがあるから人間の言語習得や理解を研究する必要はない」っていう主張に対して自分を擁護してるように見える。そんな主張をする人がいるの?LLMは確かにすごいけど、そのメカニズムは人間の脳とはかなり違うのは明らかだと思う。言えることは、人間の理解に関する研究を促す動機にはなるかもしれないってことかな。特に、LLMを動かしながら脳手術みたいなことができるのは、人間にはできないことだし。

面白い議論があって、チョムスキーは知能が象徴的推論に根ざしていると主張し、アシモフは統計的基盤を主張した(あれは意図的じゃなかったけどね;)。今までのLLMの設計は純粋に統計モデルだよ。浮動小数点数の山、重み付けされた関係、そしてそれらを動かすソフトウェアとハードウェア、私たちに価値をもたらすユーザーの入力と出力がある。これは、コンピュータサイエンスのアルゴリズムやデータ構造の原始的なもので作られたLuceneやSQL DBのインデックスとは異なる、与えられたデータのインデックスだ。アシモフの定義に認識できるものだよ。そして、これらのLLMは計算基盤の中に象徴的推論を全く持っていない。彼らが持っているのはシンプルな再帰モデルだけ:今までの入力を考慮して、次のトークンは何か?そして、彼らは大量の入力素材で訓練された後にそれができるようになる。内在的な推論能力も、論理を適用する原始的な能力も、基本的な論理の公理を推測する能力もない。だからチョムスキーの定義には当てはまらない。だから私たちのLLMは単なるパーラートリックに過ぎない。一発屋だよ。でも、彼らがやるトリックは非常に複雑で、私たちにとって非常に魅力的で、実用的な価値がある。これは「知能の本質は何か?」という問いに戻る。そしてそれをどう定義するのか?そして私は、LLMと2歳の子供の明らかな知能の対比を考えながらこれを言っている。

それは違うよ、シンボルは統計から生まれるんだ。異なる層で異なる概念を特定したimagenetの分析や、LLMでのアブレーション実験を見てみて。彼らは厳密な形式論理を行っているわけじゃないけど、確実に情報を圧縮してシンボルを使って操作しているよ。

私たちにとって非常に魅力的だよね。そう、なぜなら擬人化は私たちの生物学に組み込まれているから。たった二つの点と弧が、全ての人間に幸せな気持ちを引き起こすんだ。:) > 実用的な応用と本当の価値については議論の余地があるね。今のところ、LLMにとって画期的で役立つ応用は見つかっていない。私たちは信じたいけど、彼らは私たちを幸せにしてくれるから。でも、結果は伴っていない。

私にとって面白いのは、次の質問だね:知性なしで複雑な推論ができるのか?LLMは一発屋以上の存在であることを証明しているみたい。実際、推論や構造化の類似性があるんだよね。LLMの内部で直接行われているか、コンピュータコードによってサポートされているかは関係ない。例えば、最新のLLMであるGemini 2.5やClaude 4は、実際に複雑な推論を行っていると言えるかもしれない。私たちはそれには知性が必要だと当たり前に思っていたけど、もしそうでなかったら?それは知性に対する見方を大きく変えるし、動物の「知性」を定義するためにテストする主要な要素の一つを取り去ることになる。

理性的な声だね。でも、いつも通り、その声はしっかり無視されてる。大きな利益を夢見たり、生成された嘘でコントロールを行使するのは魅力的だよね。HNのコメントスレッドなんかは、もっと知ってるはずの人たちが大勢それに引っかかっている様子を示している。実際、このスレッド自体がチョムスキーの主張が全く響いていないことを示してる。

自動監視を通じてコントロールを行使することを忘れないでね。市民がラインを越えたかどうかを、巨大なオフィスにアナリストを詰め込むことなく検出するために、なんて素晴らしいツールを作ったんだろう。