世界を動かす技術を、日本語で。

ChatGPTを使ったときの脳:AIアシスタント利用時の認知負債の蓄積

概要

  • LLM(大規模言語モデル)アシスタント を使ったエッセイ執筆の 脳活動と行動への影響 を調査
  • EEG計測NLP分析 を活用し、3つのグループで比較実験を実施
  • ツール利用が脳の接続性と認知活動を低下 させる傾向を確認
  • 自己所有感や記憶再現力 がLLM利用者で最も低いことを観察
  • LLM依存による長期的な教育リスク が示唆される結果

LLMアシスタントによるエッセイ執筆が脳と行動に与える影響

  • 参加者54名 を「LLM」「Search Engine」「Brain-only(ツール未使用)」の3グループに分割
    • 各グループ、 同条件下で3セッション のエッセイ執筆タスクを実施
  • 第4セッションでは グループ交代 を実施
    • 「LLM-to-Brain」:LLM利用者がツール未使用に移行
    • 「Brain-to-LLM」:ツール未使用者がLLM利用に移行
  • EEG(脳波)計測 により、執筆中の 認知負荷と脳ネットワーク を評価
  • NLP(自然言語処理)解析人間教師・AI判定 によるエッセイ評価を実施

脳活動・言語パターン・行動への影響

  • Brain-onlyグループ :最も強く広範な脳ネットワーク接続性を示す
  • Search Engineグループ :中程度の脳活動と接続性
  • LLMグループ :最も弱い脳接続性と認知活動
  • ツール利用が増えるほど、脳活動や認知負荷が 縮小
  • NER(固有表現抽出)、n-gramパターン、トピック構造 はグループ内で均質性を示す

グループ交代後の変化

  • LLM-to-Brain参加者 :アルファ波・ベータ波の接続性が低下し、 脳の過小活性 を示唆
  • Brain-to-LLM参加者 :記憶再現力が高く、 後頭頭頂部・前頭部の脳活動が活性化
    • Search Engineグループと類似の脳活動パターン

所有感・記憶・パフォーマンス

  • エッセイへの自己所有感 :LLMグループが最も低く、Brain-onlyグループが最も高い
  • LLM利用者 は自分のエッセイ内容を 正確に引用できない傾向
  • 4か月間の追跡 で、LLMグループは 神経・言語・行動面で一貫して低パフォーマンス

教育的・社会的インプリケーション

  • LLMの即時的な利便性 と引き換えに、 認知的コスト学習への悪影響 が生じる懸念
  • AI依存が長期的な教育成果や自己効力感の低下 につながる可能性
  • AIの学習支援におけるリスク評価と設計指針の必要性

Hackerたちの意見

明らかに比較できるのは、GPSナビゲーションの習慣的な使い方だね。中には盲目的に従う人もいれば、普段通る道すら覚えてない人もいる。

これを解決するために、画面の地図を北を上に固定するのがいいって気づいたんだ。そうすると、街の形を覚えられて、位置やルート、方向の意識がすごく高まる。安くて簡単で、時間をかけて地図をパッシブに学ぶには効果的だよ。LLMに対しては、AIと「レース」するっていう似たような「ハック」をやってる。詳しいプロンプトを入力したら、自分で同じ問題を解きに行くんだ。AIが考えてる間にね。競争心があって集中できるし、早く良い解決策を見つけたときは嬉しいよ。

GPSナビに頼りすぎるのは脳の健康に本当に悪いって読んだことがある。https://www.nature.com/articles/s41598-020-62877-0 これはちょっと怖いね。自分自身のGPSへの過剰な依存を考えさせられるけど、特に心配なのは、GPSロックが取れるまで車が動かない若い親戚のことなんだ…無限に。

私はずっとこの問題を抱えてる。頻繁に行く場所は重要じゃないって脳が思って、他のことのために忘れちゃうんだ。覚えるためには、何度もその場所に行かないといけない。そうじゃないと、すぐに忘れちゃう。GPSのおかげで、これが問題じゃなくなったけど、私は頻繁に使ってる。でも、GPSがこの問題を引き起こしたわけじゃない。普及する前の5、6年間は運転してたからね。

これは私にはあまり影響しない問題だと思う。なぜなら、どこかに行くときは3回目か4回目にはナビを使わないって計画してるから、方向を覚えようって気持ちになるんだ。LLMの使い方にどうつながるかは分からないけど、同僚たちが本当に悪い習慣に陥るのを見てきたから、ほとんど避けてる。例えば、問題を解決するために2時間でできることを、プロンプトを調整するのに何日もかけるようなことね。自分の考えを外注するようなことはしたくないな。

速く目印で道を見つけられる人もいれば、そうじゃない人もいるよね。職場でそれを実感したことがある。大きな建物を移動する時、俺はすぐに道を見つけられるけど、他の人はエレベーターから出たら左に行くのか右に行くのかもわからなかったりする。その能力はGPSとは関係ないんだよね。道を見つけるのに時間がかかる人もいるし、数学や読書、作文にもっと時間をかけないと他の人と同じくらいできない人もいる。

定期的に使うルートを知らないのは、GPSに頼りすぎて自信を失ってるからだと思う。外国の街にいるときは、どこに行くか地図をチェックするんだ。左や右に曲がる順番を簡単に覚えられるけど、実際にはまた地図と自分の位置を確認して、「まだ正しい道を進んでるかな?」って思っちゃう。時々、確認しすぎてイライラして、しばらくは見ないようにしようとすることもある。毎回確認するのはストレスだよね。もし毎回確認しなくても、今いる場所と地図の位置を合わせる必要がなければ、周りのことにもっと気づけるし、もっと楽しめるかもしれないし、他の面白そうな道を選ぶ自由も感じられるかも。これに関しては、みんなが本当に定期的に使うルートを知らないのか、それとも単に自信がないだけなのか、よくわからないな。

ドルイドたちは、識字が人々の聖なる教えを暗記する能力を奪うって言ってたんだよね。彼らの言う通りだ!でも、識字は結局進んで、私たちはみんなそのおかげで賢くなったり、逆にバカになったりしてる。

ドルイド?ソクラテスはずっと前から本に反対してたよね。面白いことに、彼が本に反対した理由は、今やLLMによって解決されてる。

それはもっと複雑だよ。学習の三本柱は、理論(物事を知ること)、実践(物事を行うこと)、メタ認知(正しいこと、または重要なのは間違っていることに気づくこと、そして自分を修正すること)。それぞれのステップが神経経路を強化するんだ。どれも何らかの形で必要不可欠だよ。識字や本、知識を他の場所に保存することは、頭の中で全てを覚えておく負担を軽減するけど、それらはそのプロセスには影響しない。だから、これは非常に悪いメタファーだね。もっと適切なのはGPSで、それは実践だけを残す。LLMはここに関わってきて、どんなメンタルスキルの柱も壊しちゃう。深く学ぶ必要がなくなるし、LLMが全ての文章を書いてくれるから、練習も必要なくなる。そして、もちろん、間違っても自分が間違ってるわけじゃないから、何も学ばない。LLMを使って脳を成長させる方法もあるけど、縮小させるのではなくね。彼らを個別の教師にして、各生徒のリズムに合わせて問題を出させることができる。用意された解決策ではなく、問題を出してもらう。完璧にできるタスクだけに使う。彼らに依存しないことが大事。でも、これはOpenAIやAnthropicが私たちに与えてくれる未来じゃない。今日も、100年後も、常におべっか使いを運営する方が利益が大きいからね。LLMを「良い」ものにしたいなら、私たちが戦わなきゃいけない。

スマートフォンが一番ダメージを与えたと思う。昔は人の電話番号を暗記しなきゃいけなかったし、家から誰かのところまでの道を覚えるのも、GPSが毎回教えてくれるから、地図を広げてルートを考えることが少なくなったよね。事前にルートを確認して、Googleストリートマップで重要な部分を見ておくと、迷う可能性がかなり減ることに気づいた。「あ、これ見覚えある!ここで右に曲がる!」って感じで。妻も似たような経験があって、大学のプロジェクトで道路を往復してレポートを書くことになったんだけど、地図を買って読んだら、同じ地域で育った妹よりもそのエリアについて詳しくなったんだって。AIは、質問しているテーマについて本からもっと学ぶための素晴らしい機会だと思うし、AI自身にソースを尋ねることもできる。常にもっと権威のあるソースから情報を確認することが大事だね。AIが10分節約してくれた?その10分をソース資料を読むのに使えるよ。

このコメントは話題から逸れてる気がする。アナロジーは妥当だけど、本物ではないね。

ソフトウェアチームのための素晴らしい心理学者、キャット・ヒックスと彼女の妻で神経科学者のアシュリー・ジュアビネットが、彼らの優れたポッドキャスト「Change, Technically」でこの研究のさまざまな問題について話しているのをぜひ聞いてみてほしい。 https://www.buzzsprout.com/2396236/episodes/17378968 1: https://www.catharsisinsight.com 2: https://ashleyjuavinett.com

「TL;DR」はあまり好きじゃないけど、52分は十分な長さだと思う。トランスクリプトのランダムなポイントに飛んでみたけど、ただの当たり障りのないことばかりで、全部を聞こうとは思えなかった。彼らの主な結論についてもっと情報があればいいんだけど。

タイトルに重要な部分が欠けてるよね。「... エッセイライティングタスクのために」

うーん、逆に考えることが増えてる気がする。自分が計画してきたことを全部実現できるかもしれないって思うと。少なくとも俺が使ってる方法では、ADHDの俺にとって完璧な補助装置みたいなもんだ。クレイジーなことを話しながら使えるインタラクティブなノートが手に入った感じ。確かに万能薬ではないけど、機能がめちゃくちゃ上がってるのが実感できる。みんなが言うほどの量は使ってないし、むしろちょっと精神的に不安定なジュニアの同僚とペアプログラミングしてる感じ。そうじゃなければもっと時間がかかってたと思う。実際、いろんなプロジェクトで長文のLaTeXの説明をたくさんしてるけど、めちゃくちゃ楽しんでる。ADHDがないかのような体験をしてるかも。

今、論文を書いてるんだけど、まさに同じことを考えてる。これが普通の人の感じ方なんだろうね。

具体的にAIをどう使ってるのか詳しく教えてくれない?コーディングのため?それとも「すべて」に使ってるの?

もしかしたら、脳を使わなくなったからってバカになってるわけじゃないのかも。信頼できる火を起こす方法を手に入れたから、火花にこだわるのをやめて、もっと大事なものを作ることに集中できるようになったって感じかな。

同じ気持ちだよ。これってADHDの脳がアイデアをたくさん持ってるからなのかな、それとも神経的に普通の人も同じなのかな?

抽象的な部分にはすごく共感できる。今はもっと生産的になったし、長期プロジェクトに取り組むのがすごく楽しみなんだけど(特に一人でやるとき)、細かいことが前よりもずっと大変だって感じてる。それがLLMが出すものを見直す能力を妨げてると思う。ADHDの診断は受けたことないけど、テストも受けてないんだ。考えたことはあるけど、スペインではあまり診断されてない気がする。

確かに、AIがあると仕事が孤独じゃなくなる気がするし、私にとってはプラスだよ。集中力にはまだ欠点があるけど、それは改善できるかな…

AIを使いすぎると感じることを裏付けてる気がする。始めるのは簡単だけど、問題に対して脳がいつもより関与してないのを感じる。これが本当の理解の障壁になって、流れから外れてしまう。最近、AIがなければこんなに早く取り組めなかった複雑なものに取り組んだんだ。スギヤマフレームワークに基づく階層グラフレイアウトアルゴリズムで、ノードの配置にはBrandes-Köpfを使った。全くの未経験だったし(しかもその複雑さを過小評価してた)、AIがアルゴリズムの基本的な理解を得るのにすごく助けになった。でも、実際のコードを書くのをAIに任せたのは間違いだった。これが細かい部分を理解するのを妨げて、問題に本当に関わることができなくなって、結局AIに問題を直させることになったけど、その時点でAIも何をしてるのか分かってなくて、逆に悪化させてしまった。だから、AIに実際のコードを見せるのをやめて、Copilot IDEプラグインからスタンドアロンのCopilot 365アプリに切り替えた。そこで各ステップの原則を説明してもらいながら、コードをデバッグして修正して、何が起こっているのかを実際に理解できるようになった。そして、やっとコーディングの流れに戻れた。だから、AIに実際の仕事を任せるんじゃなくて、インタラクティブな百科事典として使うのがいいよ。こういう複雑な問題にはそれが一番効果的だと思う。

まさに私の経験と同じだね。私たちはこの獣をどうにかしないといけない。

いいエピソードだね、同感だよ。スキルの向上は練習から来るものだし。AIを使うのがタダ飯みたいに思えるけど、スキルの萎縮というコストが伴うんだ。インタラクティブな百科事典として使う場合でも、情報を検索したり集約したりするスキルが少し失われるかもしれないけど、多くの人にとっては時間やエネルギーの節約という全体的なトレードオフが価値があると思う。もっと他のことをする余裕ができるからね。

友達が20代の人たちと働いてるんだけど、最近、昼休みの時間を計算するのが大変だって話してたんだ(適当な時間の30分後)。若い同僚の返事は「私はそれをChatGPTに入れるだけだよ」って。若い子たちは簡単な計算にChatGPTを使ってるんだね…

これは大丈夫、ただの人間の進化の次のレベルだから。計算機が出てから、基本的な数学を知る必要はなくなったよね。今では、私たちのAIも読んだり書いたりしてくれるし、もっと時代遅れのスキルだね。今はもっと高次のことに集中できる。火花に集中する必要はなくて、重要なものを作ることに集中できる。どうせSNSのおかげで、5秒以上集中力を持っていられないしね。もし私の言ってることが分からないなら、たぶんADHDじゃないんだろうけど、それでもいいよ。

面白い結果が出そうだね。俺は血のボウルの統計にいくつかのLLMを使ったけど、簡単な計算すら間違えることがあった。まあ、数学用に作られてるわけじゃないから、納得できるけどさ。結果がどれだけ間違ってるかは驚きだよ。同じプロンプトを6つのAIに入れてみたら、6通りの間違い方をしてたし。ちなみに、一番面白かったのは、ジェミニにGoogleシートで何かやってもらおうとしたら、ずっとExcelって呼んでたこと。訂正した後もね。

これって新しいメディアが出るたびに繰り返されるパターンを思い出すね。ソクラテスは書くことが記憶を壊すって心配してたし、グーテンベルクの批評家たちは熟考を危惧してた。小説は「脳を柔らかくする」って言われてたし、テレビは「バカ箱」って呼ばれてた。でも、「彼らは以前に間違ってたから今も間違ってる」ってのが証明になるかは分からない。この研究には疑問があるんだ。 - 参加者54人、重要な4回目のセッションには18人しかいない - 4ヶ月は根本的に新しいツールに適応するにはほとんど不十分 - 「脳の接続性が減少」って悪いこととして捉えられてるけど、効率的なリソース配分も特徴かもしれないし - エッセイを書くことは特定のタスクで、「一般的な認知」に extrapolate するのは無理があると思う。研究が指摘するかもしれない点は、以前のツールは部分的なプロセスをアウトソースしてたこと。計算機は算数を、Googleは事実を保存する。LLMは思考から形成までの全ての認知プロセスを引き継ぐ可能性がある。それは質的に違う。だから、これを軽視する傾向があるのかな?多分そうかも。でも、正直なところ、まだ分からないと思う。歴史的なパターンは認知能力が消えるのではなくシフトすることを示唆してる。このシフトがプラスかマイナスかは、20年後にまた聞いてみて。

歴史的なパターンは、認知能力が消えるのではなく、シフトすることを示唆している。何にシフトするの?これ? https://steve-yegge.medium.com/welcome-to-gas-town-4f25ee16d...

もっと研究が必要だね。完全に同意するよ。とはいえ、テレビは確かにバカの箱だよね。テレビ自体のせいじゃなくて、見ているもののせいだけど。実際に面白くて引き込まれる番組や映画はいいけど、前回チェックしたときは、ほとんどが低品質のゴミや常にニュースの爆撃でいっぱいだった。計算機は計算をするし、高校のときに手でやってたような計算を今やれって言われたら、できないと思う。簡単な計算は頭の中でできるけど、もっと複雑な計算をする能力は減った。確かに、やってないからだけど、複雑な計算はスマホを取り出しちゃうからね。

4ヶ月は根本的に新しいツールに適応するにはほとんど足りない。 そうだね、でもこの全体がすごく速く進んでいるから、4ヶ月前のものはほぼ時代遅れになっちゃう。未来も同じで、2026年1月22日の最先端に基づいて今から始まる研究は、2026年5月22日にはすでに時代遅れのモデルやワークフローを含むことになるだろう。こんな風に全体の景色が変わっていると、完全に適応するのは難しいかもね。 > 前のツールは部分的なプロセスを外注していた - 計算機は計算をし、Googleは事実を保存する。LLMは思考から形成までの全ての認知プロセスを引き継ぐ可能性がある。それは質的に違うよね。そうだけど、これがどのチームにも当てはまることも考慮してね:全てのマネージャーは、自分の比較優位に集中できるように、全体の認知プロセスを外注する人を雇うんだ。「全てを知っていた最後の男」という本は、1829年に亡くなったトーマス・ヤングについて書かれている;それ以来、記録された知識の総和はあまりにも広がりすぎて、誰もが全てを学ぶことはできなくなったから、専門家が必要なんだ。AIは私たちの心の補完で、両方の側面がある:私たちとは違って、AIは「全てを学ぶ」ことができるけど、人間と比べるとあまり上手くはない。もし私たちの誰かがSFやファンタジーのタイムループや一時停止があって、インターネット全体を読むのに十分な時間があったら、これらのモデルよりずっと有能になれるだろうけど、そんなことはないし、AIはそれを可能にするハードウェアで動いている。今のところ、マネジメントスキルを持っていること(そして、検証よりもポッパーの反証を知って使うこと)が重要だから、AIの弱点を発見して補うことができるんだ。

とはいえ、「彼らは以前に間違っていた」というのが、今間違っていることを証明するかは分からない。もっと良いフレーミングは、「新しいツールやメディアを過剰に使うことは、悪影響をもたらす可能性がある」だと思う。何が過剰利用かを明確に定義するのは難しいから、さらなる研究が必要だけど、特定のケースではデメリットがあることを受け入れるのは健康的なアプローチだと思う(たぶんすべてに当てはまる)。

「彼らは以前に間違っていた」というのが、テレビがバカの箱だということやその後のすべてに当てはまるかは分からない。

テレビは「バカ箱」だった。テレビは超バカ箱で、ポータブルスマートバカ箱の軍隊の大元帥だね。

あなたが挙げた例は、どれも「知性」として売られているわけじゃないよ。

それはすごく間違った比較だと思う。君が言うように、LLMは全体の認知や創造的プロセスを支配しようとしていて、それは算数を外注するよりも大きな問題だよ。

小説やテレビは良い例じゃないと思う。プロセスを代替しているわけじゃないからね。執筆の方がいい例だ。私にとっての重要な違いは、AIは現在、完全な専門知識を置き換えることはできないってこと。対照的に、本が扱えない「より高いレベルのストレージ」なんて存在しないし、人間の記憶だけができることもない。AIを扱うには、シニアのサポートが必要だよ。シニアを育てるためには、ジュニアに監督のもとでリスクの低い機械的なタスクを何年も実行させる必要がある。AIがそれをやる世界では、シニアがいなくなっちゃう。

「ソクラテスは、書くことが記憶を壊すんじゃないかと心配してた。」彼の言ってたことは正しかったかもね…今、私たちの頭の中は違う風に働いてるのかも。

これが予想外だとは思えないな。「脳を積極的に使う vs AIを評価する」ってのは、神経的には「アクティブリコール vs ノートを読む」と同じことだよ。

AIに関する極端な意見を見るのはちょっと疲れる。AIはコードの停滞や製品作りの万能薬じゃないし、生産性を奪うわけでもない。AIは道具であって、この研究はせいぜい、特定のコーディング作業に脳の力をあまり使っていないことを示してるだけ。メンテナンスやコードの管理については調べてるのかな?それが、バイブコーディングをしているときにやらされることだから。

インターネットでの生ぬるい意見?ここがどこだと思ってるの...? ここでは絶対的なことしか扱わないよ。