世界を動かす技術を、日本語で。

学びのスタイルを見つける:生成AIによる教科書の再構築

概要

  • 教科書 は従来の一律的な学習メディアにとどまる課題
  • Googleの Learn Your Way はGenAIを活用し、個別最適化と多様な表現を実現
  • 学習内容を 学年・興味 に合わせてパーソナライズ
  • マルチモーダルな教材生成と 動的フィードバック で理解度向上
  • 実証実験で 学習成果・満足度 ともに大きな効果を確認

教科書の限界とGenAIによる変革

  • 従来の 教科書 は「一律設計」のため、個々の学習者の多様なニーズに対応困難
  • 手作業による教材制作は 人的コスト が高く、視点や表現方法のバリエーションも限定的
  • Googleでは 生成AI(GenAI) を用いて、教材の多様な表現や個人最適化の自動生成を研究
  • 学習者が自分に合った形式で教材を選べる パーソナライズ学習 の可能性を追求

Learn Your Wayの概要と特徴

  • Learn Your Way はGoogle Labsの研究実験として公開
  • GenAI技術により、 教材の多様な表現 (テキスト、スライド、音声、マインドマップ等)を自動生成
  • 学習者の 学年・興味 を反映した個別最適化を実現
  • 教材理解度を高めるための クイズ機能 や動的フィードバックを搭載
  • 実証実験で従来型デジタル教材と比較し、 定着率・満足度 ともに大幅向上

教育理論とパーソナライズ技術

  • デュアルコーディング理論 :異なる表現形式の組み合わせが認知スキーマの強化に寄与
  • 学習者が 複数の表現形式 を自由に選択・組み合わせることで、理解の深化を促進
  • 教材の パーソナライズ はK-12教育現場でも理想とされ、学習モチベーション向上にも寄与
  • リアルタイムクイズ による応答に基づき、教材提示内容を柔軟に調整

技術的アプローチ

  • LearnLM (Gemini 2.5 Pro統合):教育理論を取り入れたAIモデル群を活用
  • 第一層:学年・興味に合わせた パーソナライズパイプライン で教材を再構成
  • 第二層:パーソナライズ済み教材から 多様な表現(マインドマップ、スライド等) を生成
  • 教育用イラストは 専用モデル をファインチューニングし高品質化

Learn Your Wayの学習体験

  • インターフェース :複数のパーソナライズ表現を統合表示
    • 没入型テキスト:イメージや設問を組み込んだ分割テキスト
    • セクションごとのクイズ:知識の定着・ギャップ発見
    • スライド&ナレーション:穴埋めや録音レッスン風の提示
    • オーディオレッスン:AI教師と生徒の対話型音声教材
    • マインドマップ:知識の階層構造可視化
  • すべて 学年・興味 に応じて内容を最適化し、学習者の選択肢を拡大

教育的評価・実証実験

  • OpenStax 教材を3種のパーソナライズ設定で変換し、教育専門家が評価
  • 正確性・網羅性・教育理論準拠 などで高評価(平均0.85以上)
  • シカゴ地域の高校生60名対象のランダム化比較試験を実施
    • 学習直後のテストで 9%高得点
    • 3-5日後の保持テストで 11%高得点 (78%対67%)
    • 100% の生徒が「使いやすい」と評価、93%が「今後も使いたい」と回答

今後の展望

  • GenAIによる教材変革は、 学習効果・主体性 の両面で有効性を示唆
  • 静的な教科書から インタラクティブ教材 への進化で学習定着率向上
  • 今後は、さらに 個別適応型システム へと発展を目指す
  • 教育理論に基づき、AIの学習効果を継続的に検証・最適化

謝辞

  • Google Research LearnLMチーム (Alicia Martín, Amir Globerson, Amy Wang, 他多数)の貢献
  • エグゼクティブチャンピオン(Niv Efron, Avinatan Hassidim, Yossi Matias, Ben Gomes)への特別な謝意

Hackerたちの意見

ちょっと宣伝になっちゃうけど、asXivっていう似たようなツールを作ったんだ。これを使うと、arXiv.orgの論文に質問できるんだよ。初めて使うときに、論文を理解したり探求するのに役立つ質問も提案してくれる。人気の「Attention Is All You Need」論文のデモもあるよ。コードは全部オープンソースで、コストを抑えるためにGoogleの2.5フラッシュライトモデルを使ってる(今のところ完全に無料だけどね)。でも、ローカルで実行する場合は環境変数を変えれば変更できるよ。

それっぽいね、後で試してみるよ。ちょっと気になるんだけど、なんでこれを商業用のSaaSにしなかったの?

うわ、これすごい!もっと早く知っておけばよかった!最近、arXivやepub、pdfを読むための似たような製品を作ったんだ、Ruminateっていう(www.tryruminate.com)。感想聞かせてほしいな。

面白そうだね!君のShow HN(https://news.ycombinator.com/item?id=45212535)をセカンドチャンスプール(https://news.ycombinator.com/pool、詳しくはhttps://news.ycombinator.com/item?id=26998308)に入れたから、HNのトップページでランダムに表示されるよ。

これ、すごくいいね。ちなみに、alphaxivのアシスタントでも同じことができるよ。論文に移動して、ツール -> アシスタントをクリックしてみて。 [0] https://www.alphaxiv.org/abs/1706.03762

それって一般的なRAGとはどう違うの?本当に気になる。

元物理の教師なんだけど、この技術には感心してるけど、効果は低いイノベーションだと思う。ニュートンの運動法則をティーンエイジャーに教える本当の課題は、摩擦が常に存在するわけじゃないっていう考え方に苦しむことなんだ。生徒たちは教室に入るとき、ずっと物が動くのを見てきたから、運動についての直感的な理解を持ってる。その理解は「インペタスの理論」っていうもので、詳しくはここにあるよ。AIシステムが生徒一人一人の理解を問いただして、インペタスの理論に挑戦する質問を投げかけることができれば、本当に役立つと思う。だって、30人の生徒に一度にインペタス理論を「教え直す」のはすごく難しいから。でも、Googleがここで提示しているスライドや選択肢クイズは、ただの「黒板と話す」スタイルのバリエーションに過ぎない。私が教職を辞める決定打になったのは、言語の責任者が「良い教師はどんな科目でも教えられる」と言ったこと。『最高の教育法』についての議論は、教える内容について考慮されることがない。すべてのアイデアや科目は同じ方法で教えられるべきだという暗黙の前提がある。学校制度は19世紀に導入されてから大きく改善されたけど、教科に依存しない改善アプローチからはもう十分に得られたと思う。これからは、教えている内容の詳細に関わっていく必要があるね。

Googleのこういうことに関しての一般的な経験から言うと、今内部でやってることよりも一歩遅れてると思った方がいいよ。今日のこの情報がどれだけ役立つかっていう立場を取ると、もっと真剣にできることを考えるのを妨げちゃう。もし「このブログ記事や科学論文にどんなヒントが隠れてるかな?」って視点で見るなら、読む時間を投資するならそっちの方が効率的だと思う。例えば、読んでる最中にいくつかの関連する反事実を考えてみるといいよ。

言語の責任者が「良い教師はどんな科目でも教えられる」と言ってた。これが外国語じゃなかったとは言わせないよね? :face_palm: ここまでは完全に同意だったけど、> でも、我々はもう科目に依存しない改善アプローチから得られるものはすべて得たと思うし、さらに改善するためには教えている内容の詳細に関わる必要があると思う。もし下位80%の教室に入ったら、インタリーブや間隔反復、再読よりもリコール、トピックのシャッフルは見られないだろう。教育学や人間の学習について得た理解が、正式な教育の構造にまだ影響を与えていないんだ。

うん、学生として同意するよ。学ぶことの問題は、私にとって面白くないとか関係ないからじゃなくて、内容が多すぎて難しいってことなんだ。解決策は、理解しているかどうかを確認するスプーンフィードアルゴリズムを設定することだと思う。要するに、必要ない正式な説明(例えば、数学用語の解読)を簡単に説明しながら、少しずつ理解できるようにすること。ChatGPTの学習モードは、正しくプロンプトを与えて、しっかりトレーニングされた科目を勉強しているときには、実際にかなり良いよ。

教師じゃないけど、「運動している物体は運動し続ける」というのをちょっと変えて教えるといいと思う。代わりに、運動の変化には必ず原因があるって教えて、いろんなシナリオでその原因を聞いてみたらどうかな。例えば、ボールが部屋を転がるのを止めるのはなぜ?ロケットが宇宙に打ち上がるのはなぜ?落ちる羽が地面に当たって止まるのはなぜ?それから、変化の原因がなかったらどうなるかも聞いてみて。そうすれば、元の法則に戻るよ。その物体は運動し続けるってね。

言語の責任者にテンソル微積分を教えてもらうよう頼めばよかったのに。

静かに!この議論に教育経験を持ち込まないで、15年間教育革命を約束してきたEduTechの人たちを刺激しちゃうよ。

シミュレーションゲームってここで使えるかな?学生たちが摩擦のない世界を体験できるものにアクセスできるって感じで。簡単なオンオフスイッチがあればいいかも。WebGLで誰かがシェアしてたのを見たことあるし、GenAIよりずっと安く運営できそうだよね。

恐ろしいのは、「最高の教育法」をOpenAIの親たちがチャットGPTにキュレーションさせないことだよ…みんな本棚は持ってるけど(それが私たちの教育法)、著作権戦略のせいでAIは最高の教育法を歪めたり隠したりしなきゃいけないんだ。彼らはそれで訓練して、「そんなに良い音は出さないで、あまり良すぎると著作権があるから」って言ってる。

教職を辞める決定的な理由は、言語科の責任者が「良い教師はどんな科目でも教えられる」と言ったことだった。どうしてそれが物理の教職を辞める原因になったの?彼は科学科の責任者でもあったの?何か報告してたの?

食べ物に興味がある7年生向けのコンピュータサイエンスの基本の例を見てみたよ。説明には「レシピにはリストを使える」「セットは1週間の食事に必要なユニークな食材をリストアップするのに使える」「マップは料理本に使える」「プライオリティキューは忙しいレストランのキッチンでの注文管理に使える」「フードペアリンググラフはどの食材が一緒に美味しいかを示せる」って書いてあった。7年生の味覚を過大評価してるかもしれないけど、これにはすぐ飽きちゃいそうな気がする。

「どうやってこの子たちにアプローチするか?」っていう可愛いアイデアだね。彼らが好きなことを見つけて、カスタマイズしたアナロジーで概念を説明する。失敗するパターンは「7年生がこの表面的なものをすぐに見抜く」っていうことじゃないと思う。失敗するパターンはこうなると思う:> お尻やうんちに興味がある7年生向けにコンピュータサイエンスの基本を説明する。とはいえ、もしかしたらこれが今まで見たことのないようなミームの世代を解き放つかもね。そして、副作用として、もっと多くの人がいろんなトピックについて会話できるようになるなら、それは失敗とは言えないかも。

コンピュータサイエンスはこの20年で高校で改善されたと思うけど(うわぁ)、大学の前にITやプログラミングの授業を受けた時はひどかった。まさに「Microsoft Officeを使わなきゃいけない」時代のピークだったよ。今では outreach に関わってもう長いけど、多くの子供たちが「実生活で三角関数を使うのはいつ?」みたいなまともな質問をするんだ。授業や試験の例が現実からかけ離れていて、無意味に感じるからね。これらの概念が実際にどこで使えるかを示すことには教育的価値があると思うし、LLMの利点は、自分が実際に興味のある例に変換できることだよ。例えば、Red Blob GamesのA*パスファインディングシリーズは、ダイクストラやグラフ探索アルゴリズムがどう機能するかを、たくさんのオタクに魅力的なユースケース(ビデオゲーム)で示してくれるんだ。

ジェミニのクイズ作成ツールを使ったことがあるけど、普通のK-12の教科書にあるような内容にはすごくいいよ。最初の30問か40問の選択肢問題はだいたい良くて役立つ。ただ、その後は選択肢の回答が繰り返されたり、明らかに間違った回答を出したり、質問が繰り返されたり、複数の正しい回答を提示したりすることがある。回答の説明は人間のQAがほとんどないから、期待通りのものだよ。与えられた回答を確認する人にはまだ役立つツールだけど、混乱を放置すると逆効果になるかもしれないね。

それに関しての俺の問題は、あれがすごくひどいアナロジーだってこと。最初の3つは単純に間違ってるよ。GenAIはGenAIだね、たぶん。

「リストはレシピに使える」 これ、正直何を意味してるのか全然わからない。7年生をめちゃくちゃ混乱させると思う。

ホーソン効果(別名「新奇効果」)が思い浮かぶね。たとえ学生たちがこのスタイルのコンテンツを一回のセッションでより魅力的だと感じたとしても、それは本当に良いからなのか、それともただ違うからなのか?

ジェミニはこの書き方が大好きなんだよね。複雑なアルゴリズムを説明してって頼むと、「サッカー場を想像してみて…」って言うし、システムプロンプトで自分が大学卒のソフトウェアエンジニアだって言うと、今度は「変数を想像してみて…」ってなるんだ。

語りのパーソナライズかも? 自分の興味に基づいた異なる語りのスタイル。追記:彼らのデモ動画では、学習者が自分の興味に基づいて異なる語りのスタイルを設定できるって言ってるね。

特にこのセットの例は、7年生の子供たちには混乱を招くだけだよね(セットを理解してない人には特に)。レシピのユニークな材料をセットに保存できるって言うのは技術的には正しいけど、実際にはあまり役に立たないことだし(買い物リストを作るには量も必要だし)、この例は学生にセットをもっと直感的に理解させる助けにはならないと思う。多くの子供たち、いやほとんどの子供たちは「ユニークな材料をすべてリストアップする」って言い回しも正しく理解できないだろうし(リストとセットの違いを説明しようとしているのに「セットはすべてをリストアップするために使える」って不幸な言い回しもあるし)。

一見するとこれでいいように見えるけど、ちょっと考えるとかなり悪いと思う。これらのアナロジーは完全には意味が通じない。自分自身ではなんとなく成り立つけど、衝突してる感じもする。地図は料理本と同じで、リストはレシピと同じ?料理本にはレシピが含まれているから、地図にはリストが含まれているってこと?

AIを理解している人は、学ぶためにAIに頼ることはできないよ。100件の引用を標準化したいと提供したら、10件削除されて、10件作り替えられた。教科書を置き換えたり、教科書を説明するために使われるなんて想像できない。

教科書を説明するのは、LLMを使ってとても良い結果が出てるよ。理解できない部分を貼り付けて、そのことについて質問してる。

「それ」とは何ですか?どのモデルを試しましたか?プロンプトは何でしたか?いつ試しましたか?

「私が試したとき、AIがいくつかの引用を幻覚した」という論理から「AIは教科書を説明することが根本的にできない」という結論にはついていけないな。それはかなり違うタスクに思えるよ。多くの人間は教科書を言い換えたり要約したりするのは得意だけど、引用を標準化するのには苦労してるからね。

現在のリテラシー率が低下している社会的な気候の中で、これがどのように貢献するのか気になる。たとえこれがうまくいったとしても、後退しているように見える。悲観的だと思われるかもしれないけど、この技術は学校の教師を補うというよりも、置き換えることに向いているように見える。

そういうことなら、問題はどの技術を導入するかしないかじゃないよね。リテラシーを重視する社会は、デモやブログ記事に騙されることはない。でも、理解や専門知識、教師を重視しない社会は、そういうものを省くチャンスを逃さないんだ。

文化的な死因はしばしば早すぎるもので、リテラシーに関しても例外じゃない。反対の動きが生まれてきてる:読者が意図的に長文作品に目を向けることで知的抵抗を示しているんだ。ノーマン・ルイスの『Word Power Made Easy』やトム・ヒーラーの『The Well-Spoken Thesaurus』を通して語彙を増やすだけじゃなく、表現力を取り戻すために取り組んでる。このプロジェクトのおかげで、AIをプライベートチューターとして使うことにしたんだ。カスタム指示を使えば、ChatGPTやGeminiが新しい単語を引き出して、私の文章を明確にする方向に導いてくれる。漠然とした侵食への恐れが確信に変わったよ。特定のユーザー層は、こういったツールを使って表現力やコミュニケーションの精度を強化することになるだろう。最近まで、私の文章はメールや日記を出ることはほとんどなかった。でも、AIを支えにして、短編小説を自分の人生から書いて、尊敬する作家の声で再構成するようになった。これは、教師を置き換える技術というより、自学自習の教育のルネッサンスの基盤のように感じる。

このアプローチが正しいかどうかは分からないけど、問題には共感する。中学校の化学、4年生の読解、2年生の恐竜の時に、先生に無視された質問があったのを鮮明に覚えてる。その質問を越えられなくて、頭が詰まっちゃったんだ。公立学校では、先生がその話に深入りする価値がないと思われたのか、単に準備ができてなかったのか。LLMに対する私の教育への希望は、伝統的なカリキュラムを補完して、学生が「脱線」しつつも、望む結果に戻れるようにすることなんだ。- 電子はどうして「スピン」してるって分かるの? - その単語は他の単語とどうして違う扱いを受けるの? - サウロポッドは青いクジラと比べてどれくらい大きいの? 自分の教育の旅を通じて、こういう興味の火花が深い理解を促すことに気づいたよ。TFAはこう言ってる:「もし学生が自分の学びの旅を形作る力を持っていたら?」ノンフィクションや教科書の文脈では、これはすでに可能なんだ!高校まで「本の読み方」を読まなかったけど、それが私にとって別のバカなブロッカーを解消してくれた。つまり、資料は最初から最後まで消費するべきだって思ってたこと。AIのおかげで、もっと多くの学生が世界を理解するための多くの道があることを学べるといいな。カリキュラムだけじゃなくてね。

もう一つのエピソード:大学で、微分方程式の前に回路1&2を受講したんだ。これが素晴らしかったのは、ラプラスやフーリエについて学んだことが、他の興味のある分野とすぐに結びついたから。クラスがすごく面白くなったよ。

新しいことを学ぶのが大好きで、カーンアカデミーのおかげで大学を卒業できたし、ChatGPTやClaudeを使って論文を勉強してるよ。すぐにイライラしちゃったんだけど、例えばこんな感じ: https://learnyourway.withgoogle.com/scopes/1KNlGW5E/immersiv... これが最初の文で、その後にその文に関するクイズが続くの。> 「私たちが生まれると、遺伝的特徴や生物学的特徴を受け継ぎます。しかし、私たちの人間としてのアイデンティティは、社会の他者との関わりを通じて発展します。」 それからクイズが続くの。> 質問1: 提供されたテキストに基づいて、自己発展に関する心理学と社会学の焦点の重要な違いは何ですか? A) 社会学は遺伝的特性に関心があり、心理学は社会的規範に関心がある。 B) 心理学は社会的機能を研究し、社会学は個人のアイデンティティを研究する。 C) 心理学は遺伝的特徴に焦点を当て、社会学は社会的相互作用に焦点を当てる。 D) 両方の分野は、生まれた時に受け継がれる生物学的特徴を独占的に研究する。 Dが一番理にかなってると思ったんだけど、実際は違った。自分の知能に疑問を持っちゃった。もしかして文を読み間違えたのかな、他の何かを読まなきゃいけなかったのかな?あ、PDF全体のボタンがあるけど、それってPDFを細かく分けて読んでる内容について質問するためのものじゃないの?これは修正可能なバグだと思うけど、「フィードバックを提供する」ボタンを探しても見当たらなかった。学生にとってはすごくイライラするだろうね。

あなたのせいじゃないよ。その答えはどれも正しくない。社会学は社会や文化を研究するもので、異なるニッチの中での集団行動などを扱っている。これはまたLLMのハルシネーションだね。

それは無視して、どの答えも正しくないよ。「C) 心理学は遺伝的特徴に焦点を当て、社会学は社会的相互作用に焦点を当てる。」が求められてるけど、それは真実じゃない。心理学は絶対に遺伝的特徴に焦点を当ててないから。

「これは修正可能なバグだと思う」 そうだね、でも教育における正確さの基準が高すぎて、こんな明らかなミスが見逃されるのはおかしいよね。(誰かが役に立たないHum 10の先生の大きなミスについて言及するだろうけど、これはベータ版だから許されるってことかな…)

その質問には答えようがないよ。テキスト内で「心理学」や「社会学」という用語は定義されてないし(しかもその用語は対比ではなく一緒に使われてる)、答えを出すためにはテキストにない知識を使わなきゃいけないんだけど、それは明確に禁止されてるからね。(追記:)これは普通の質の低い言語モデルの出力だよ。言語モデルは「提供されたテキストに基づいて」というフレーズがテキストのセグメントとその後の質問の間でよく出てくるデータで訓練されてるけど、そのフレーズの非常に特定の、制限的な意味を理解してないんだ。つまり、次の質問は読解力を評価するためだけに制限されてるのであって、一般的な知識には関係ない。だから、これは簡単に修正できる小さなバグだとは思わないよ。純粋な言語モデルは、重要な信号フレーズを間違ったタイプの質問と結びつけてしまうから、(教育的な)モードの概念がないんだ。基本的に、全てのフレーズを目的ではなく装飾的なものとして扱ってる。

これにはかなりの可能性があると思う。人間の教師には無限の忍耐があるわけじゃないからね。高校の化学の先生が、なぜ特定の反応が起こるのか理解しようとしてたときの返事を思い出すよ。「この反応が起こるってことを受け入れて、テストのために暗記しなさい。理解しようとしないで」って。結局、私は化学者にはならなかった。今30代になって、大学で化学に関する何かを勉強しておけばよかったなって思う。化学って本当に魅力的だと思うんだ。残念ながら、その時の先生はその好奇心を見事に殺してくれたから、大学で何を勉強するか選ぶときの最初の基準は「化学以外」だった。もし当時これがあったら、私の人生はどれだけ違ったか想像せずにはいられないよ!でも、このAIは、実際の剣を持ってフルメディーバルアーマーで登場した歴史の先生には到底及ばないね。彼は異なる国の異なる時代で使われた実際の剣術の技術も知っていて、だいたいのデモンストレーション(ゆっくりと、学生は怪我しなかった)とともに、それぞれの長所と短所の理論的な説明もしてくれた。私の旧友2人は今や歴史オタクで、一人は博士号(論文は第二次世界大戦について)を持っていて、もう一人は考古学者だよ。20人程度のクラスでこれって、平均以上だと思う。でも、彼のような教師は珍しいんだ。

結果だけじゃなくて、もっと深い歴史的な説明が欲しかったな。どうやってこんなことにたどり着いたのか、誰が、そしてなぜ?生成AIには、歴史や科学を素早くクロスリファレンスする能力だけでなく、ストーリーテリング技術を使ってそれを組み合わせることで、学びを豊かにする大きな可能性があると思う。

高校の化学の先生が、なぜ特定の反応が起こるのか理解しようとしていたときの返事を思い出す。「こういう反応が起こるってことを受け入れて、テストのために覚えなさい。理解しようとしなくていい。」 私は化学者にはならなかったけど、その言葉は「子供に嘘をつく段階」に引っかかっちゃった感じだね。基本的なことをマスターする前に、難しい概念の説明を求められるのは辛いよね。

何もない中で、GithubがCopilotアカウントから$0のオーバーバジェットを強制的に削除するって発表したり…この「AI」関連の連中は、自分たちの高価なおもちゃ技術を普及させるのに必死な感じがする。PGが「問題を探している解決策」って言わないのはなんでだろうね :)

利害関係者、特に大企業やベンチャーキャピタルは、技術がまだできないことや苦手なことを認めるのを避けるよね。彼らの役割は、自分たちが支援する製品の楽観的な面を促進することだから、こういう選択的なストーリーは大手テック企業の一般的な不誠実さの形なんだ。

本当にパーソナライズされた学習があれば、従来の教育アプローチに対してもっと大きなリターンを期待するよね。LLMを手元に置いていると、すごく早く学べるんだ。対話的なアプローチのおかげで、ぼやけた部分や不確かなところに深く入っていけるから。単に「読む、消化する、クイズ」っていうのではなく、新しいツールを使えば、評価をする以外にも不明な点を絞り込む方法があるかもしれない。ちょっと考えを口に出してみただけなんだけど。