世界を動かす技術を、日本語で。

チャットボット時代の大学試験の実施

概要

  • École Polytechnique de Louvain での「Open Source Strategies」授業の試験運営体験談
  • 学生主体の学びと ストレス軽減 を重視した独自の試験ルール
  • Chatbot(LLM)利用の可否 を学生に選ばせた実験的取り組み
  • 学生のLLM利用傾向と 成績の相関 に関する観察結果
  • 「ストリーム・オブ・コンシャスネス」 という新しい試験手法の導入と効果

オープンソース戦略の試験運営体験

  • 試験 は本来ストレスの源であり、著者自身も苦手意識
  • ストレスを 学びの機会 に変えるため、従来の試験観を覆す運営
  • 学生への説明を重視し、 期待する回答 や助言を個別に伝達
  • 以下の独自ルールを設定:
    • 資料・インターネット利用自由
    • 時間無制限 (長時間は根本的問題の兆候と認識)
    • 学生間の議論許可 (実際は促さないと発生しない)
    • 自作の試験問題持参可 (実施者は少数)
    • 好きな服装で受験可 (多様なコスチュームが登場)

Chatbot(LLM)利用可否の選択制

  • リソース利用自由 のルールから、Chatbot利用の是非も議論
  • ChatGPT等のLLM利用 を学生自身が事前に選択・申告
  • 選択肢A: Chatbot不使用宣言 (違反は不正行為扱い)
  • 選択肢B: Chatbot使用宣言 (利用時は以下厳守)
    • 利用時は 都度申告
    • プロンプト内容 を開示
    • 誤りの指摘と理由説明 の義務
    • 違反や誤り放置は 減点対象
  • Chatbot出力の責任 を学生自身に課す方針

学生のChatbot利用傾向と成績

  • 60名中 57名がChatbot不使用 を選択
  • 不使用理由を4グループに分類:
    • 個人主義型 :自力解答に誇り、Chatbotは最終手段
    • 完全不使用型 :LLM自体に嫌悪感
    • 実利主義型 :今回の試験では不要と判断
    • ヘビーユーザー型 :ルールの厳しさ・責任回避で利用回避
  • 各グループごとの 成績傾向
    • 個人主義型: 15~19点 (優秀層)
    • 完全不使用型: 13点前後 (中間層)
    • 実利主義型: 12~16点 (やや中上位層)
    • ヘビーユーザー型: 8~11点 (下位層)

実際にChatbotを使った学生の事例

  • 3名のみChatbot利用
    • 1人目:利用忘れ(実質実利主義型)
    • 2人目:数回のみ活用し、 自信確認 目的
    • 3人目:複数LLMを組み合わせる複雑な運用も、 出力の誤りに気づけず苦戦
  • Chatbot利用は、 使いこなせる人ほど不要と感じやすい 傾向

カンニング(不正行為)への世代的恐怖

  • Chatbot利用=責任負担増 → 利用回避傾向
  • 学生は 不正行為への恐怖心 が非常に強い
  • Google検索の自動生成回答でも「不正扱い」かを心配
  • 協力・情報共有 すら不正と見なされる現代の学生文化
  • 教員時代の「みんなで情報共有」は今や難しい状況

ストリーム・オブ・コンシャスネス手法の導入

  • 2026年試験で 「ストリーム・オブ・コンシャスネス」 (意識の流れ)記録を導入
    • 削除・修正禁止
    • 思考のまま記述
    • コピペ禁止(URLのみ例外)
    • Chatbot利用不可
  • 60名中55名が提出、 自己理解やストレス軽減 に効果
  • 「書きながら問題が明確になり、ストレスが減った」という声も
  • 失敗した学生の救済材料 としても活用

まとめ

  • 試験の在り方・学び方 を問い直す実践
  • ChatbotやAI活用 の責任と限界の教育的示唆
  • 学生の心理的安全性・自律性 を重視した試験設計
  • 世代間ギャップ や現代の不正行為観の変化への気づき
  • 新しい学びの手法 としてのストリーム・オブ・コンシャスネスの有用性

Hackerたちの意見

ほとんどの学生はチャットボットを使いたくないみたいだけど、これは急速に変わってると思う。俺は大学の教授なんだけど、LLM(大規模言語モデル)が必要な学生が急増してるのを感じる。まだ、最年長の学生は最初の1年をLLMなしで過ごしてるけど、若い学生は学業の間ずっとLLMを使ってきた。将来的には、LLMの助けなしでは全く働けない世代の学生が出てくるんじゃないかと心配してる。

いや、なんでも反論しなくてもいいよ。教授がここで何をしたのか、そして学生がこの特定の科目の試験で出力を信頼しなかった理由について話してみたらどう?

LLMがユーザーに本当のコストを請求し始めたら、どうなるか見るのがすごく楽しみだね。多くの人が高くて手が出なくなったら、どうやって対処するんだろう?

記事を読んで、教授も学生も教えられている内容に興味を持っていて、だからこそ積極的に学びたいと思っているように感じたので、LLMを使うのは最良の戦略ではないと思いました。私の感覚では、多くの学生にとって、コースの内容をしっかり理解することが主な目標ではなく、良い仕事を得るためにコースを通過することが主な目標です。このグループにとっては、LLMを使うのは理にかなっています。私が学生だった頃、親や学校に「これが正しいことだ」と言われて興味のないコースを受けていたとき、もしLLMがあったら絶対に使っていたと思います :)

Googleは検索をぶっ壊して、あのダメなLLMボックスに置き換えたよね。学生の欲求がここでの原動力だって本当に思ってる?

ここで教授は、試験の文脈外で一般化できない「特別な」ケースを提示したと思う。「AIを使わない」か「AIを使うが、その結果を受け入れる」という選択肢があった場合、試験の準備をしっかりしていれば、チャットボットは魅力的な選択肢にはならないと思う。

...は本当に指数関数的に成長してるね。あるいは幾何学的に?

ここでの一つの助けは「恐れ」だね。大学では形式的なミスで落とされることがあるから、みんなそれを恐れて注意深くなるんだよ。「大学ではLLMを使えない、自分で考えなきゃいけない」ってことを知ってれば、試行錯誤で調整するだろうね。LLMに頼らない方法を教えられない教育システムで育つことは、運のいい同級生と比べて、実質的にずっと不利になるって主張もできると思う。批判的思考は、最後まで練習し続けるスキルなんだ。

  1. 試験中に学生同士で話し合うのを許可してるんだ。テーマに沿ってればね。そうなると、彼らも一緒に卒業証書をもらうべきなんじゃないかな、「$other_studentがいないと試験に合格できないかもしれない」って。チームで採用することを支持する会社もあるから(全員か誰も採用されないってやつ)、そういうチームでいたいなら問題ないかもね。

うん、もっとルールについても気になるね。例えば、両者が議論に貢献しなきゃいけないとか(:

俺たちはすべての卒業証書をOpenAIに送って、高等教育を終わらせるべきだと思う。教育を受けてない人の方が、TikTokのフィードで操りやすいしね。

ハハ、確かにそうだね。でも、彼は学校に孤立感と厳しい競争の文化があるって言ってるから、それに対する反応かもしれないね。

OPです:オープンソース戦略を教えています。主な戦略は協力です。もしあなたが賢いなら:1. 問題を特定する 2. 誰かに聞く 3. 理解を深める答えを得る そうすれば、どんな基準でもかなり良いことをしていると言えます。もう一つのトリックとして、私は時々こういうことをします。ある学生が概念をうまく説明できないとき、その学生を一人選びます。次に、その概念を理解していない学生を一人選びます。学生1に「20分で学生2にその概念を教えて。戻ったとき、彼の答えに基づいて評価するから」と言います。(もちろん、私はそれだけを評価するわけではありませんが、両者に追加の努力を強いることになります。学生2は学生1の失敗の原因になりたくないですからね。)

新しいツールに合わせて試験を適応させるのは、かなり考えられた方法だと思う。もっと他の大学もこんな風に早く適応してほしいな(学生を理解しようとしたり、期待を明確にしたり、学生から学んだりする姿勢が大事だよね)。大多数の教授はストレスを抱えていて、学生をバカにしてる…少なくとも10年前はそんな感じだった!

OPです:ほとんどの教授は、標準試験に合格するのが得意だったから教授になったんです(正直言って、他に得意なことがない人もいます)。私は違って、悪い学生でした。最低限の成績で卒業証書を取得しただけで、いつも何にでも反発していました。でも、私の大学にはオープンソースが本当に重要だと思っている良い人たちがいて、その分野で良いキャリアを持っている人が必要だったんです。私はその人でした(そのポジションを提供してくれたことに本当に感謝しています)。

多くの学生、いや、たくさんの人が悩むのは「なんで何かを知っておく必要があるの?」っていう質問だと思う。ほとんどの人にとって、特に私もそうだけど、大学を卒業したら答えは「クビにならない程度に知ってればいい」ってこと。これって、ほとんどのカリキュラムが求める知識よりもずっと少ないし、年々「クビにならない程度」って基準がどんどん低くなってる。LLMがある今、フルタイムの仕事の90%ではほぼその基準が地面に近い。だから、私はこのコースとは正反対のアプローチを提案するけど、著者の自由な考え方には敬意を表するよ。伝統に戻るけど、ひねりを加えてね。閉じた本での試験、ノートシートなし、すべて手書き。口頭試験も追加して、試験時間が大幅に増えるけど。宿題は出さない、そうすると「完了主義」に陥って、課題を提出することが理解することよりもリアルに感じちゃうから。問題集を何千問も作って、解答付きで公開して、カンニングのインセンティブをなくす。「暗記は創造性の前提条件」って、クラスの全ての方程式を暗記させた物理の教授についてのHNのコメントを言い換えたもの。LLMの時代では、これが三重に真実だと思う。

これは、もし目標が良いものを選別することだったら素晴らしいけど、現代の西洋教育はできるだけ多くの授業料を払う学生を合格させることに重点を置いていて、できればその過程でそこそこ楽しめる経験を提供することが重要です。

閉じた本での試験、ノートシートなし、すべて手書き。口頭試験を追加する あなたが言っているのは、私の学校生活(イタリアだけど、ヨーロッパの多くは同じだと思う)での経験そのものです。中学校から大学までずっとそうでした。評価付きの宿題のアイデアは、ずっと不思議に思っていました。 > LLMの時代では、これが三重に真実だと思います。学ぶ価値があるものは変わりますよね?「ああ、成績が」と言う反応は馬鹿げていると思いますが、カリキュラムを適応させるのは狂ったアイデアではありません。

大学を卒業したら答えは「クビにならない程度に知ってればいい」 私は、同じ流れを続けて人類の知識の総和に貢献することが目的だと思っていました。だからこそ、人々は大学が本来の原則を失い、市場の力に反応して現在のアメリカ企業が求めるタイプの卒業生を生み出すようになったと批判するんでしょう。 > 「クビにならない程度に知ってればいい」という基準はどんどん低くなっています。通常、人は知識やその欠如ではなく、行動によってクビになります。デイビッド・グレーバーの核心的な主張が正しかったのかもしれません。ほとんどの仕事は実際には「クソみたいな仕事」で、インターネットの時代には、実際には正式な教育を受けなくてもできる仕事です。

「口頭試験を追加しよう、たとえそれが試験時間を大幅に増やすとしても。宿題は出さない、"完璧主義"を助長するから。」不安やADHD、その他の記憶に関する問題を抱えている人にとっては恐ろしいことだよね。これって、人工的なプレッシャーの中で情報を瞬時に暗記して思い出せる学生にとっては最適化されてるだけなんだよ。小学校の頃、試験の前後には理解してることに答えられたのに、試験中は真っ白になってたこともあった。自分の理解や知識を示す最良の方法は、実際にその知識を使うプロジェクト課題や、君が取り除きたいと思ってる「宿題」の例だと思うんだけど。情報処理の仕方が違う人たちに対して、知識や理解を示すための他の方法を考えるアイデアはある?

問題はもはや「どうやって人を教育するか?」ではなく、「仕事や能力って何のためにあるの?」になってる。文化は能力からパフォーマンスへと移行した。大学が中流階級の生活への入り口だったのが、今では借金の元になってる。あらゆる社会的パフォーマンスが、能力を持って働くことよりもずっと価値がある。能力は中心的な存在だったのに、今ではどんどん周辺的になってきてる。AIはそれを反映し、さらに強調してる。

電磁気学の教授が、「方程式を暗記する必要はない。どういう関係が形成されたのかを理解することが目的だ」と言ってた。そうすれば、各方程式が表す関係を理解できるようになる。これがこの発言の基礎だと思う。方程式を暗記することは、関係を理解するための基盤を与えてくれる。だから、これで十分だと期待してるのかもしれない。でも、物理は実際には数学や方程式についてではなく、システムが時間とともにどう進化するかの構造やダイナミクスについてだから、これは十分じゃないと思う。方程式はそのシステムの進化を表す一つの方法に過ぎないから。

でも、「解雇されないために十分」というのは、「なぜ何かを知るべきなのか?」という質問への答えにはならない。正直言って、あなたの投稿の残りが「なぜ何かを知るべきなのか?」という初めの質問や、「どれくらい知っておくべきか?」という暗黙の質問に答えようとしているのかはっきりしない。

学生が何かを暗記するべき理由には答えていないよ。「暗記は創造性の前提条件だ」という手を振るような理由を除いて。学生たちは、卒業後に忘れても安全なことを暗記するよう求められたとき、教育システムに疑問を持つのは当然だった。ほとんどの機能的な大人が学校で学んだことを忘れたと認めていたしね。これはLLMが登場する前からの問題で、今はさらに悪化している。ところで、私は今「暗記は創造性の前提条件だ」という意見には100%賛成だけど、16歳の自分を納得させようとしたら、手を上げてしまうだろうね。

なんで何かを知っておく必要があるの? 明らかな答えは「面白いから」だよね。でも、もし君が厳密に実用的な観点で考えてるなら、どれだけの努力をしてどれだけのリターンを得るべきかってことになる。君に言いたいことが二つある。まず第一に、君が生きているのは無意味な人生だってこと。第二に、君がLLM(大規模言語モデル)があるから何も学ばないとしたら、僕は面白いからすべてを学ぶことになる。そうすると、君と僕が競争する時、僕もLLMを使ってることになるよね? 同じ道具を使うけど、僕は推論できるのに君はできない。だから「なんで何かを知る必要があるの?」って悩んでる人は、結局何も学ばないと思う。学ぶには好奇心が必要だし、少なくともたくさんよく学ぶためにはね。もし好奇心があれば、何を学ぶべきかなんて考えないはずだよ。

よく見落とされがちなのは、LLMへの依存だね。今の学生は、LLMが常に手頃な価格で利用できると思ってる。もしLLMの料金が突然1ユーザーあたり月1000ドルになったらどうなる? それともリクエストごとに1000ドルだったら? 新しい学生や新しいプロフェッショナルは、まだ仕事をこなせるのかな?

理解できません。10年前、私たちは理解したことを手書きで試験に書いていました(頭の中で)。同僚もいなければ、ノートパソコンも、インターネットも、LLMもありませんでした。このアプローチは今でも通用するのに、なんで他のことをする必要があるんですか?学生のGoogleを使う能力を特にテストしているわけでない限り、アクセスする必要はありません。

オープンブック試験は新しいものじゃないし、STEMの分野(数学や生物学)ではよく経験したよ。科目によっては、しっかりとした理解がないと合格できないことが多い。何かをググるだけで試験に合格できるなら、それはただの暗記力を試してるだけで、もっと合成や批判的思考スキルが評価されるようなデザインが必要かもしれないね。

大学にいた頃、オンラインコースを推進する動きがあったのを見たよ。教授たちは学生に興味を探るためのアンケートを取ってたけど、あんまり人気がなかった。動機は明らかだったと思う:授業料は同じかそれ以上にして、運営コストを減らす。もしかしたら、リモートで受講する学生を増やすために入学者を増やすことも考えてたのかも。学位の価値が薄まって、質が悪くなっていくのに。なんで非営利の公立大学が利益最大化を目指してるの?

一度技術が採用されると、元に戻るのが本当に難しいよね。ほとんどの人は、その技術が本当にプラスかどうかを評価できないと思う。採用は合理的というよりも社会的なもので、だから人々に社会的価値観や行動を変えるように求めるのと同じことになる。

一つの可能性として、これは理解する能力よりも記憶する能力を重視しているってことかもしれない。最後の試験は10年以上前で、名前や数字を覚えるのが得意だったから、いつも良い成績を取ってた。でも、ほとんどの名前や数字は調べれば済むから、これをテストするのはあまり意味がないと思う。大学で勉強してた時、ある教授がほとんど講義に出席しなくても4年生の試験を通過したって噂があった。彼は写真記憶を持っていて、試験の前夜に必要な証明が載っている本をパラパラめくっただけだったんだ。それで、理解していなくても十分なポイントを得られたんだよね。もちろん、そんな記憶力を持ってる学生はごく少数だけど、私みたいに簡単に物事を覚えられる人に有利を与えるのは必ずしもフェアじゃないと思う。

物理の持ち帰り試験があって、インターネットや本は使えても他の人はダメだった(でもそれは名誉コードに基づいてた)。あれは人生で受けた中で一番難しい試験の一つだった。数ページにわたる数学的な導出があったからね。数学をうまく構築できるLLMなら、実際にその問題をかなりうまく解決できたと思う。

このアプローチはまだ有効なんだから、他のことをする理由は何?一つの問題は、各作品を採点するために与えられる時間がどんどん減っていることだ。時には20ページに15分しかもらえないこともあって、管理側は9時から5時まで昼休み30分で連続して採点できると思ってる。人々を正気に保っているのは、提出しない学生や明らかに質が低いものを提出する学生だけだ。だから、可能な限り、試験を設計する際もテキストを制限しようとする。選択肢問題、線を引く、基本的な図、計算などね。中にはひどい字を書く学生もいるし、試験室でダムターミナルを使うのには反対じゃない。もしかしたら、バックグラウンドでテキストを同期してバックアップしてるかもしれない。> 学生のGoogleを使う能力を特にテストしているわけじゃないなら、アクセスは必要ないよ。私は学生をテストする側だったけど、いつもすべてを覚えているわけじゃない。時には、学生がそのトピックを理解していて、正しい情報を見つけるための直感を持っていることを示せれば十分だと思う。

私は授業でこのモデルに戻ってきてる:ペンと紙のクイズ、デジタルデバイスはなし。個々に緊張を和らげるために、同じ重みのクイズを7回やってる。プロジェクトやプログラミングの重みを60-80%から50%に減らしたのは、学生が実際に作業をしたかどうかを判断するのが難しいから。

10年前、私たちは自分の理解したことを手書きで試験を書いてた。君もそうだったけど、私が受けた中で一番良い試験はオープンブックで何でも持ち込み可だった。25年以上前の話だよ。別の教授は「A4の用紙を一枚持ち込んで、好きなメモを取ってもいいよ」ってやってたこともある。

私は修士課程で教えてる。学生たちは全国や世界中に散らばってるから、手書きの試験は難しいんだ。幸いなことに、彼らに出すエッセイの問題は、チャットボットがひどい提出物を出すような内容だから。

今、学校に通ってるけど、ほとんどの授業は実際に紙と鉛筆のテストを強制してる。採点やコーディングが面倒なのにね。

私は学生たちがカンニングを恐れているあまり、試験の前にほとんど協力しなくなっていることに気づいた!少なくとも、私たちがやっていたほどではない。これは私に説明された世界とは根本的に違う。20年前ですらカンニングは蔓延していて、悪化しているとしか聞いたことがない。

私は修士課程で教えていて、ここ数年で約15%の学生がカンニングしてる。明らかにカンニングしてるのがわかる、例えば二人の学生が100%同じ回答を提出するような感じ。

でも、このクラスは他のクラスで同じ学生たちがやってることをあまり代表してない気がする。

うわぁ。この先生に教わりたかったな :-) この設定はすごく考えられてるね。学生に選択の自由と責任を与えてる。もし彼らがより強力なもの(LLM)を選んだら、自動的により多くの責任も持つことになる(LLMの間違いを説明しなきゃいけないから)。そしてこれ:> 「大学を卒業してから20年かかって、今のコンピュータに関する知識を身につけた。君たちの前にいる理由は一つだけ:僕より早くやること。僕よりも良く、深くやることを確かにしてほしい。もし僕を出し抜けなかったら、僕は失敗したことになる。」

彼女が試験を終えたら、部屋に戻って残っている学生たちにどの問題が出たか、どう解いたかを教えてくれた。私たちはそれを「カンニング」とは考えなかったし、教授としても、良い学生(早く試験を受けることを選ぶことが多い)には残りの学生を助けてもらうように試験を設計してる。君は例外だね。私が学校にいた頃は、外部の助けを受けることはカンニングと同じだったし、実際の犯罪とは違って、学生がカンニングしていないことを証明するのは学生の責任だった。疑いがあるだけで名誉委員会に呼ばれることもあった。しかもそれは広まっていて、国際学生の40%はカンニングしてたと思う。捕まった学生は文化的な規範を弁護に使ってた。大学はその学生たち、あるいは彼らの所属機関が現金で授業料を払っていたから、決して躊躇しなかった。

アメリカの大学院にいる留学生たちは、見た感じだと基本的に学位を買ってるようなもんだよ。教授たちは彼らがカンニングしてるのを知ってるけど、あんまり気にしてないみたい。学生たちはお金をたくさん払ってるし、その分のものは手に入れるだろうね。

教授が学生にLLMの出力が正しい理由を示すように求めるのに、Google検索には同じ要求をしないのが変だと思う。AIが出る前のGoogleでも、SEOによって内容が左右されるから、批判的思考が必要だったし。誰かが誤情報を流してお金を稼げるなら、それがランキングを上げることもあったからね。

ノルウェーでも似たようなスキャンダルがあったよ。人文学と工学の最大手のUiOとNTNUが、以前は素晴らしい内部メールサービスを持ってたのに、優秀な人材からの大規模な抗議を無視して、今は全部Outlookになっちゃった。マイクロソフトは、技術に詳しくない関係者を上手く説得して、自社のスタッフがバカだと思わせるのが得意なんだよね。外部の立場で試験を採点したこともあるけど(法的な要件で)、LLMの最大の問題は、弱い学生が不要なコマンドラインスイッチを使ってコピペすることだと思う。でも、彼らはStack Overflowでも同じことをしてたはず。中には、LLMを使って自分の文章を改善しようとしてるって言う人もいるけど、それが学びの部分なのに、なんで??? 失敗することへの不安があるんだと思う。彼らは、意味不明な文章でも自分がやってることを理解してれば、私は彼らを落とさないってことがわかってないみたい。卒業して、物事がどうあるべきかを知ってるから、今は試験が全然怖くない。無能だから落とされることはあっても、ちゃんと書けなかったからじゃないからね。すべての学生が同じ特権を持ってるわけじゃないし、それは時間をかけて得るものだよ。コンピュータサイエンスの課題や論文は、形がかなり標準化されてるのも助けになってる。