世界を動かす技術を、日本語で。

英語の授業で自分をChatGPTに置き換えてみた

概要

本記事は、大学の英語クラスにおけるAI(特にChatGPT)の活用と、その倫理性や学習効果についての実験的取り組みを紹介。 学生のAI利用実態や意識調査、AIと人間の協働による創造性の変化を考察。 AIの利便性と限界、創造性の均質化リスクについても議論。 教育現場でのAIの役割や、今後の人間とAIの協働の可能性を検証。 学生たちのリアルな反応や学びの変化を通じて、AI時代のリテラシー教育の在り方を問う内容。

英語クラスにおけるAI活用と学生の反応

  • 学生たちは ChatGPT を「Chat」と呼び、 学習ガイド作成・エッセイ課題解釈・履修登録 など幅広く活用。
  • メール文書のプロフェッショナル化 や、教授への連絡文の添削にもAIを利用する傾向。
  • 教員側は 生成AIの教育現場導入 について、2年間にわたり検討・実験を実施。
  • AI活用の是非 や、書く力を学ぶ意義について学生自身が議論し、最終的にAIが教員を代替できるか投票で決定。
  • 大学教育の目的として、 新たな読者・書き手の育成 を重視。

AI利用の倫理観と利用実態調査

  • AI=電卓 というOpenAI CEO Sam Altmanの比喩を紹介し、学生の意識調査を実施。
  • 電卓利用は非倫理的 と考える学生はごく少数、AI利用に関しては 「中立」や「やや否定的」 な回答が多い。
  • 実際のAI利用状況として、 校正(50%)・ブレインストーミング(56%)・アウトライン作成(28%)・初稿編集(22%) など多様な用途で使用。
  • AI利用の倫理的曖昧さ や、学生の混乱・迷いを確認。

AIと人間の文章比較・学生の学び

  • AIと人間それぞれで執筆 し、出来栄えを比較する課題を実施。
  • 学生は AIの文章を「味気ない」「没個性」と評価 し、AI特有の癖(例:引用の幻覚、三つの例示、emダッシュの多用)を発見。
  • AIの弱点を見抜く力 が養われ、批判的読解力が向上。
  • AIは一次草稿には不向き だが、 発想支援や編集には有用 との評価が多数。

AIとの協働と創造性のジレンマ

  • MITの論考を紹介し、 「人間対機械」ではなく「人間+AI」協働モデル の有効性を考察。
  • Centaur Chess(人間+AI) の例を通じて、AIをパートナーとする発想の重要性を議論。
  • AIは「個別コーチ」や「補助輪」的役割 として活用するべきとの提案。

創造性に関する実証研究とAIの限界

  • NPR報道の研究 を参照し、AI補助下の創作が 独創性・出版可能性で8~9%向上 した事例を紹介。
  • 「最も創造性が低い」書き手がAIで大きく改善 される傾向。
  • しかし、 AI補助作品は似通う傾向 が強く、独自性の喪失リスクを指摘。
  • 学生がAIに提案させたエッセイテーマも 内容がほぼ同一 となり、創造性の均質化問題を実感。

教育現場におけるAIとの共存の課題と展望

  • AI活用の功罪を踏まえ、 「AIを使うからこそ人間の書く力が重要」 という認識の必要性。
  • AIは道具であり、目的は人間の成長 であるという教育観の再確認。
  • 今後のリテラシー教育 では、AIとの協働を前提とした 批判的思考・独自性の涵養 が不可欠。

Hackerたちの意見

このエッセイは、AIが書いたテキストの類似性を強調していて、結果を「言葉のサラダ」と表現しているところが共感できた。あと、ロシア文学の先生が言ってたことを思い出した。第二次世界大戦前のソ連作家たちの「明るい未来」をテーマにした小説は、厳しい政治的コントロールの下で生まれた作品で、始まりも終わりもない一つの大きな小説のように読めるって。こういう灰色で同じような感じになるのは、権力者や検閲によって、あるいは同じAIの助けを借りて、自分たちが「合唱」のように考えさせられるときに起こるんだよね。

今経験してるように、市場の統合によってもね。

アルトマンの例えは成り立たなかった。計算機は論争の余地がない。今は計算機は問題ないけど、最初に安くて広く普及したときは、数学の授業では使えなかったんだ。最初は四則演算だけの計算機、次はグラフ計算機が許可された。でも今でも、プログラム可能な計算機は多くの学術的な場面で禁止されてる。

正しい教育ってのは、知識がどう発展してきたかをざっくりと速習するようなもんだね。計算ツールを使うのは、そのプロセスの対応するポイントに進むにつれて意味があると思う。正直、スライドルールだけを使うプレカリキュラスと微積分の部分があって、次に複雑さが増す計算機(あるいは一つの計算機の機能が増す)を使うべきだと思う。「これを実生活でどう使うの?」ってのは、次のレッスンを学ぶ期待がないっていう宣言だよね。

加算機や計算機の概念も、100年かけて徐々に浸透していった。商業的に成功した最初の加算機は1890年代に市場に出て、ポケット計算機は1980年代に普及した。AIは理論から、数年で手書きの数学の宿題を写真から答えるようになったんだ。

80年代後半のティーンエイジャーだった頃、HPの計算機をプログラムして「H2SO4」みたいな入力文字列から分子量を計算させてた。まるで秘密の超能力を持ってる気分だったよ、特に競技試験に参加してるときは。私はすごく真面目な子供だったから、そういうことが明示的に禁止されてたらそのプログラムは使わなかっただろうけど、少なくとも私が知る限り、禁止されてなかったんだよね。

アルトマンの例えは成り立たなかったね。電卓は特に問題視されていない > 今は電卓は問題視されてないけど、安くて広く普及し始めた頃は、数学の授業では使えなかったんだ。TFAの著者は、一般的なことじゃなくて、自分の学生たちに特に言ってるんだよ。彼は学生たちにアンケートを取った結果、電卓は不倫理的とは思っていないけど、AIについてはもっと懐疑的だったんだ。今の学生たちの意見で、一般論じゃないよ。

中学生が代数の試験でグラフ電卓を使うなんてありえないよね。

それに、非常に誤解を招く比較だよ。基本的な電卓の機能は、数学の授業で教えられることを全く置き換えない。ChatGPTを使って、文章全体を書く(構成を置き換える)とか、アイデアを提供する(創造的な部分を置き換える)ことは、2つの大きな数を足すこととは全然違う。数学で言うなら、学生に定理証明器を渡したり、Wolfram Alphaにステップバイステップの解答を出させるのと同じで、今のところ誰もそんなことを許可してないよ。だって、ChatGPTを使って書くことが本来の目的を台無しにしちゃうから。大学の時、試験中は基本的な電卓は使えたけど、プログラムできるやつはダメだったし、CSの授業はペンと紙だけのところもあったよ。教授がちょっと厳しかったらね。

完全に正しい。90年代、学校で電卓を使うことは教師の間でかなり議論されてたし、机の上に出すかどうかは教師次第だった。2年生の時、ある先生が「消しゴムなんて信じない」って言ってたんだよね、鉛筆を「元に戻す」やつ。6歳の俺はこのフレーズが全然理解できなかった。「俺は持ってるけど、実在するよ!」って思ってた。

あなたが(みんなが)見落としてるポイントは、スキルのグラデーションにおける相対的な位置なんだ。1年生は算数のテストでどんな電卓も使えないだろうけど、8年生は科学用の(プログラムできない)電卓は許可されることが多い。学年が上がるにつれて、下のレベルの機能を持つ電卓が使えるようになるんだ。教育する時は、学生に実際にその科目を学んでもらいたいから、理解したら次の目標に進むための道具を与えるんだよ。既に知ってる小さな機械的な概念の負担を軽くして、次のより高度な概念に慣れやすくするためにね。AIシステムはTIのプログラム可能な電卓よりもずっと進んでるから、階層をきれいに区切って、それを「1-4のタスクを手伝って、5+はダメ」って言って強制するのは難しいんだ。だから、厳密に学習ツールとして使うのは現実的じゃない。自分のワークフローを分析するためにかなりの自己規律と自己反省が必要だけど、それはドメイン全体に一般化できるわけじゃない。

計算機は今や議論の余地がないね。そう、間違いなく悪いものだよ。計算機を使わない学校の方が成績が良いし。残念ながら、SATやACTでも計算機を使うことが当たり前になっちゃった。

計算機が手頃になった時、数学の授業がどれだけ変わったか想像してみて。実際は変わってないよ。計算機が導入された時に数学の授業を受けてたけど、高校レベル以上では、問題は計算機なしで解けるようにカリキュラムが組まれてたから、あまり役に立たなかった。1997年に大学の数学の授業を教えた時もそうだった。グラフ計算機は使っても良かったけど、それを使おうとした学生は逆に混乱してた。最初から計算機やコンピュータを使うカリキュラムに変えたかったな。道具として使うべきで、同じ古い問題やクイズをこなすためだけじゃなくて。Jupyter Notebookを使わせてあげて。数学教育は成功した試しがない。教育は常にヒューリスティックを使って学習を導き、パフォーマンスを評価するというジレンマに直面してる。例えば「三段落エッセイ」なんて、実際の世界では役に立たないし、AIがそれを即座に生成できるようになるずっと前からそうだった。もしそのヒューリスティックが壊れたら、別のものを見つけなきゃいけない。ワードプロセッサも、教師が内容で論文を評価するように強制したんだ。

ほとんどの学生は過剰にコミットしてる。大学は高いから、良い投資のリターンを得るために良い成績が必要だし、AIはどこにでもいる、大学卒業後の労働力にも。そうだね。パーティーや授業をサボることに過剰にコミットしてる。著者は普通のアメリカの大学に行ったことあるの?

自分のことを話してるんじゃない?

この文脈で「過剰にコミットしている」っていうのは、要するに「スケジュールが詰まりすぎている」ってことだよね。仕事や学校、他の責任があって、リラックスする時間が全然ないから、燃え尽きちゃうんだ。

コメントで言われてるのは、あなたの視点が普遍的じゃないってことだよ。俺は大学時代にたった一回だけ授業をサボったことがあるけど(アメリカの大学でアメリカ人として)、それもパーティーのためじゃなかった。特別なケースじゃないし、授業はめっちゃ高いからね!

じゃあ「最高の学生の大半」って言い換えよう。私は、そこそこ良い数学プログラムがあるアメリカの最も安い学校に通ってた。学費、家賃、教科書、米と豆で年間17,500ドルかかる。それは結構な額だよ。フルタイムで働いても、税引き前で時給10ドル以上になるし、安い大学がある町では簡単にクリアできるハードルじゃない。高い学費に見合うだけの給料は得られないから、選択肢はあまり良くならない。授業は毎週22時間以上あるし、3〜4年で卒業することもできるけど、それだとさらにお金がかかるし、実際の負担もあまり減らない。目安としては、授業1時間につき3時間勉強するべきだって言われてるけど、だいたいそれが正しいと思った。授業によってはもっと少なくて済むものもあれば、逆にもっと時間がかかるものもあった。隣接するトピックの自己学習も必要だから、3時間はちょっと少なすぎる。学期中は、128時間/週のスケジュールみたいになるし、4年で卒業するなら100時間、借金70,000ドル抱えながらでも60時間/週はかかる。誤解しないでほしいけど、自由時間はあったよ(夏はもっと働いて、学期中は少なめにして、ローンでその分をカバーしてたから、ちょっと余裕ができた)。でも、パーティーって感じじゃなかった。授業をサボったのは、働かなきゃいけなかったり、他のもっと重要な授業の勉強をしなきゃいけなかったり、その講師の話を理解するよりも本を読む方が効率的だと思ったからだ。

それ、私だわ。でも最近、アメリカのパーティー文化が死んでるって記事を読んだよ。: https://news.ycombinator.com/item?id=44514550

私はここ6年間、平均的なアメリカの大学で一度に一つの授業を受けてきたんだけど、あなたのコメントが指している20代の学生たちは、私の実験パートナーだったりする。あなたが描写しているのは、彼らの10%くらいの話だね。彼らはグループとしてはバラバラだよ。学びに関して言えば、一度に2つ以上の授業を受けている人はオーバーコミットしていると思う。Aを取ることができるかもしれないけど、一緒に受けた授業について1年か2年後に話すと、同時に4つか5つの授業を取るのは記憶の定着にはひどい戦略だってことが明らかになる。

大学生が特にAIに自分の文章を書かせたがる理由は正当なものがある:ほとんどの学生は過剰にコミットしている; ちなみに、時々大学生にメンターやアドバイスをしてるんだけど、共通のテーマとして、彼らの授業の負担はほとんど関係ないってことに気づいた。どれだけ自由な時間があっても、時間が足りなくなる方法を見つけるんだ。こういう発言を読むと、2つの仕事を掛け持ちして授業に出ている、貧しい大学生を想像しがちだけど、正直に言うと、そういう学生は時間管理がしっかりしてることが多い。コーチングが一番難しかったのは、授業以外に本当の責任がないのに、自由な時間がいつの間にか消えていく学生たちだった。簡単なAIを使ったカンニングの他の問題の中で、これらのツールの存在がさらに先延ばしを助長するのかどうか気になる。ChatGPTに宿題を書かせるというバックアップオプションがあると、さらに先延ばししやすくなるよね > 学生たちに、いくつかの声明に対する同意を登録するベースライン調査を完了するように頼んだんだけど、「数学の授業で電卓を使うのは不倫理的だ」という文言が含まれてた。もしこの調査にもっと何かがあったとしても、この文言は誤解を招くように思える。大学レベルの数学の授業では、授業の種類や問題によって電卓を使うのが一般的な期待だろう。学生たちは、魔法のAI電卓ではなく、自分のTI-89を思い浮かべるだろうね。

そんな学生の一人として、プロセス分析やコーチングのキャリアを持つ私が面白い観察をしたんだ。私は、自由時間を自分の執筆プロセスの明確な一部として活用していて、邪魔になるものとは思ってない。毎日約1200語書いてるし、エントリー・レベルの英語の授業での大きな数週間の課題は、一つあたり1日分の時間しかかけないと考えてる。期末試験には2日かけたけど、論点を定義するためにもう1日欲しかったから。母も同じように大学を過ごしたって言ってる。たまに、真剣な論文にはもっと努力が必要だけど、大体は「課題を脳に入れて、T-2日までメンタルで勉強して、課題を書いて、提出する」って感じだった。複数のエッセイがある場合は、T-2日からT-5日までの様々な日で段階的に進める必要がある。コースウェアやインターネット、停電の影響でT-1日には頼らない方がいい。技術的には、課題が出たその日にひどいエッセイを書けるけど、結局この方法でAランクの作品を提出してる。最も難しい教訓は、T-1日まで待たないようにすること。リスクが大きすぎて、他のことを考えながら余計に考える時間を持つことの価値を上回るから。でも「自由時間が消えていく」ってことじゃなくて、単に終わった後にはどうでもいいクソみたいな作品を書いてるから、他の大事なことに対してやる気が出ないんだ。だからT-2日の妥協案が必要なんだ。何よりも優先するつもりはないけど、つまらなくても1日早くやる必要があるって認めるよ。T-1日でインターネットが落ちたら、再履修のリスクを抱えるよりは、T-2日でクソみたいな日を過ごした方がマシだから。実際に自分が書いてることに本当に興味がある時は、数週間かけて情報源を調べたり、議論を学んだり、引用を選んだりして、それを数日で作品にまとめるけど、組み立ての日はいつも与えられた時間の中でギリギリになる。そうすれば、効率的に考えて書くことができるから。全くフラストレーションがないわけじゃないけど、T-2日では健康的にイライラしてて、T-1日では苦々しくなってるから、今は早めに執筆する努力をしてる。だから、コーチングの努力として、学生たちと一緒に、執筆活動の前に非執筆活動を組み込んだ作業カレンダーを作ることを試みてみて。例えば、7日間のウィンドウを想定して、T-7日: 課題が出されたら、課題を読む。(明らかに思えるけど、実はそうじゃない!)T-6日: 自由時間に議論を考える、ゲームをしたりコーヒーを飲んだりしながら。T-5日: 紙に適当なアウトラインを作ってみる。作りたい議論ごとに1文、矢印で並べ替える。完全な文じゃなくて、句読点もなく、構造もない。要は、試みることで脳がまとまるってこと。T-4日: 楽しみながら参考文献を調べる。あまりにも多くなってしまう。自分に引用をハイライトしてあげる。新しいツールを試すなら、2時間以内に使えるようにするか、捨てて別のことをする。T-3日: その適当なアウトラインから議論のフレーズに引用を結びつける。これでアウトラインを再編成することになるかも。Works Citedをまとめて、明日それに手をかける必要がないようにする。T-2日: アウトラインや手書きのメモを参考にして論文を書く。1段落ずつ進める。この作業に1日かけるつもりで、デスクから2時間ごとに1時間は生理的なニーズを処理するために離れる。自分にそれを強制する。T-1日: T-2日で書く準備ができてなかったものを仕上げる。理想的には、できるだけ早くこの作業を終わらせるべきで、真夜中に近づくにつれて、クラスを落とすリスクが高まるから。このスケジュールのポイントは、クリエイティブプロセスの夢見がちな部分を取り入れつつ、軌道に乗せること。論文を考えている時は、ビデオゲームをたくさんプレイする。課題を煮込んで、反射的な脳をゲームで占有するために。T-1日を使うこともあるけど、食事や水、睡眠などの生活の依存関係をうまく管理できるようになってきたから、T-2日での完了がより確実になってきた :)

期待が変わる中で、年ごとに異なるツールが使われてるね。TI-89は非常に強力だけど、MATLABやWolfram Alphaに取って代わられてる。以前は問題を「グーグル」するのが生産的だった。さらに進むと、今はLLMが計算を行うためのPythonコードを書いてる。次に何が来るかは分からないけど、今倫理的に疑問視されていることが受け入れられるようになり、新しいものが新たな疑問視されるツールになるだろうね。

大人になってから大学に戻って計量経済学を勉強してるけど、すでにソフトウェアのバックグラウンドがあるから、かなりの調整が必要だった。最も難しいのは、内容ではなく、時間がかかる評価課題が多いことだと思う。これらは入門的な科目だから、大学外でのスケジュールの自由度が少なくて、以前ソフトウェアエンジニアとして働いていた時よりも大変だ。機関としては人々の時間を尊重していないから、若い頃はそれが問題じゃなかったけど、今はかなり面倒だ。私の問題は、これが学士号であって修士号ではないことが影響していると思う。私の地域には応用経済学の修士号しかなくて(計量経済学よりもデータや数学に焦点を当てていない)、この会話は100回以上してきた。興味のある分野での修士号に変える選択肢が出たら、すぐに飛びつくつもりだよ。でも、大学に戻る選択は、ある意味消費行動でもあるし、「この男を経済学で信頼できる」と言うための紙を得るためでもある。とにかく、1年目の科目では、「あなたの理解を示す録音を作成し、その価値を説明する」みたいな評価課題がある。簡単な科目だけど、時間がかかるから、ある意味で屈辱的に感じる。以前の経験に基づいてこの科目をスキップする手段を考えたけど、これらの科目の焦点はExcelではなく、これらのことにあまり経験がないと予想しているから、後の科目で役立つように入れているだけなんだ。編集: 言い回し

一つの共通のテーマとして気づいたのは、彼らの授業負担はほとんど関係ないってこと。どれだけ自由な時間があっても、時間が足りなくなる方法を見つけるんだ。12クレジットが通常の最低ラインで、だいたい週に12時間の授業がある感じ。それに対して、教室外で必要な時間はその3倍、つまり36時間。だから、毎週48時間の学業に費やすことになる。15クレジットだと、60時間になるね。普通、仕事をしている人なら、週に50時間以上働くと燃え尽き症候群を訴えるだろうし、4年間も続けたらほぼ確実に60時間で文句を言うだろうね。

どれだけ自由な時間があっても、時間が足りなくなる方法を見つけるんだ IMO、あなたはパーキンソンの法則を観察しているね。「仕事は与えられた時間を埋めるように広がる」ってやつ。たくさんの授業を取っている学生は、時間管理ができているように見えるし、実際できている人もいるだろうけど、彼らはパーキンソンの法則の逆の恩恵も受けているんだ。もし彼らがタスクに週にX時間しか割けないなら、そのX時間を最大限に活用することになる。これは学生の時間管理スキルに関係なく成り立つことだよ。私も時間管理がひどいから、オーバーコミットして挑戦することで成功しているんだ。

どれだけ自由な時間があっても、時間が足りなくなる方法を見つけるんだ これが私そのものだと願うけど、実際そうなんだ。プレッシャーの下でしか働けないみたいで、学位が進むにつれて、仕事をどんどん遅く始めるようになって、締切の日の午前4時に始めるのが普通になってしまった。学ぶにはひどい方法だよね。

これは、マイケル・イースターの考えに関連してると思う。社会が快適になってくると、私たちの脳は「問題」と見なすものの閾値を下げるんだよね。私たちは問題解決が得意なだけじゃなくて、新しい問題を発見するようにもできてる。この考えは心理学の普及理論に基づいてると思う。

本当に楽しんだ。今のAI技術の波の中で人々がどれだけ「混沌とした中間」にいるかを示してるね。間違いなくポジティブな結果の一つは、AIが多くの人々の間で引き起こした集団的な内省だと思う。「人間」や「クリエイティ

一つ間違いなくポジティブな結果は、AIが多くの人々の間で集団的な内省を引き起こしたことだと思う。実際にそうなったのかな?ちょっと疑問だけど、もし誰かがその内省についての参考文献を持ってたら興味あるな。俺は70年代にダグラス・ホフスタッターを読んで育ったけど、彼のアイデアで好きだったのは、AIを使って人間らしさを照らし出すことだった。彼のAIの波は失敗したけど、今のAIの波にはそういう探求がほとんど欠けてるのが残念だね。

教育においてAIの使用が「カンニング」と見なされる目的の多くは、何らかの形の作文課題に関わっているから、ほとんどの教育シナリオが単にインセンティブを再設定しないのが不思議だよ。例えば、エッセイを書く課題が多い英語の授業では、その課題の成績を最終評価の0%にすることができる。締切は通常通りあるし、評価もされるけど、学生は自由にやるかやらないかを選べる。ポイントは、監督付きの単位取得試験では、似たようなエッセイを書くことが求められ、その評価は学生が課題をやった場合に得られるべき知識やスキルに基づいて行われること。利点は以下の通り:- カンニングの問題がなくなる。- 学生は大人として自分の時間や優先順位を管理(または学ぶ)できるようになり、成績のことで叩かれることが少なくなる。- すでに明確で簡潔、説得力のある文章が書ける上級生は、不要な課題に時間を無駄にしなくて済む。- 学生が課題をスキップして、ChatGPTや他のツールを使って自分の時間で文章を書くことを学び、試験条件でそのスキルを示せるなら、ウィンウィンだよ。これには、授業を担当する人が明確でテスト可能な学習目標を持っている必要があるけど、残念ながらそうでないことが多いんだよね。

これは100%試験の重み付けに移行することを意味するけど、最近数十年でそれから遠ざかる傾向があるのには理由がある。まず、ある学生は他の学生よりもプレッシャーの下でパフォーマンスが良いことがあるから、準備や知識に関係なくね。ちなみに、代替案は特にないんだけど。

大学レベルでも、多くの学生は先を考えず、短期的な思考から悪い決断をすることがある。新入生向けのアドバイスリストを見てみると、ほとんど全てに「授業に行くこと」が含まれている。授業に出ることは宿題よりずっと簡単なのに、短期的な結果がないと、たくさんの学生がやらないんだ。カンニングもいい例だよ。大学でのカンニングは蔓延していて、子供たちは与えられた仕事をやりたくないからね。「今ChatGPTを使ってエッセイを書いている子供たちに、実際にはそのエッセイを書く必要がない」と言ったら、彼らがそれでも書くことを選ぶと思うのが理解できない。彼らはすでに宿題の長期的な利益を無視する選択をしているのに、短期的な結果を取り除いたら状況が良くなるとは思えない。宿題をやらなくても即座の結果がないと言ったら、多くの子供たちはやらずに失敗するだろうし、何も学んでいないことになる。あなたはそれでいいかもしれないけど、正直言って、私はそれが悪いアイデアだとは説得しようとしているわけじゃない。ただ、もしあなたの提案が、子供たちが短期的にやらなくてもいい退屈なことを選ぶだろうという考えに基づいているなら、多くの子供たち(大人も含めて)を過大評価していると思う。

大学の授業でこれをやらなきゃいけなかったことがある(オリジナルのOpenAIのGPTが私が卒業する頃にリリースされたのを覚えていて、その時に読んで、pytorchを避けることにしたんだ。ホイールを作るのが面倒だったから)。特別な青いノートを用意して、試験の時に与えられたお題でエッセイを書くんだ。そして試験の終わりにそのノートを提出する。これはいいアイデアだと思うし、もっと多くの授業がこういう風にやらないのが不思議だけど、あなたが言うように、こういう書面の課題を評価するのは大変な作業なんだろうね。

これ、俺の英語の教授がクラスを組織してたやり方と全く同じだわ。学生は事前にリサーチして、テストの日には引用ページを完成させて来なきゃいけなかった。実際の論文は、授業中に手書きで書くスタイル。使えるのは空白の緑のノートと、直接引用を含めるための数ページのメモだけ。教授はLLMs(大規模言語モデル)については気にしてなかったけど、盗作には敏感だった。これ、うまくいってたよ。

だから、悪い日が一つあるだけで成績が台無しになるんだよね。テスト不安がある人には不利でもあるし。

課題は単に0%の価値があるかもしれない [...] 監視された単位取得の試験では、同様のエッセイを書くことが求められるだろう。うちの会社でも大学プログラムを運営していて、同じような洞察に至ったよ。ただ、君の指摘の中には間違ってるか不完全なものもあるね: - 責任ある個人を前提にシステムを構築することはできない。こういうシステムは失敗するのが確実だ。代わりに、個人は成長できるものだと仮定して、目標に向けての規律を育むシステムを構築するべきだ。これがうまくいく。 - まだカンニングの問題はあるけど、それは古い考え方で、リセットする方法を開発したんだ。 - 上級の学生にはもっと挑戦的な課題を与えるべきだ - 課題の量は学生の能力に関係なく同じであるべきだ。この解決策はGenAIが登場するまで実現不可能だった。個々のスキル向上の観点から見ると君のアイデアは魅力的だけど、オンラインコースの完了率(Udemy/Coursera - 4%未満)を見れば、なぜ対面の教育システムが機能するのかが分かる。もっと深く話したい人がいれば、喜んでお話しするよ。

俺もプログラミングの授業はそんな感じで教えてる。課題はゼロか、時々ほんの少しの価値しかない。AIとの違いは、成績のベルカーブがほぼ逆転してること。良い学生はAIを使って学びをサポートしてるし、AIに課題をやらせて試験で惨敗する学生もいる。中間層はほとんどいないね。

ライティングクラスは、たぶんプロンプトクラスに変わるべきだね(笑)。学生に明確にプロンプトする方法を教えて、AIに高品質なエッセイを書かせるように訓練するのがいいと思う。

昔はそうだったし、なぜ変わったのか覚えてるよ:すべての学生が試験のストレスにうまく対処できるわけじゃないからね。それはその科目の能力とは関係ないんだ。例えば、イギリスでは、試験の成績に偏った結果が女性の成績を男性よりも悪くすることが示されたんだ。でも、成績に課題が含まれると、女性は一般的に良い成績を取ることが多かった。これは明らかに一般化だけど、今多くのコースが最終成績に課題を考慮する理由の一つなんだ。

アメリカで大学の授業を教えてるんだけど、宿題の重要性をかなり軽視してる人が多いよね。でも、何人かの同僚が入門コースで宿題を0%にしたら、ほとんどの学生が宿題をやらなくなって、試験に落ちちゃったんだ。今の学生は、ちゃんとしたインセンティブがないと勉強しないみたい。そうじゃないと、ただ画面をスクロールしたり、快楽に溺れたりするだけ。これって、結局誰が悪いんだろうね?学生?それとも教授?

計算機が手頃になった時、数学の授業がどれだけ変わったか想像してみて。俺はその時にいたんだ。スライドルールを渡されて、11歳の数学の授業のかなりの部分はそれの使い方を教えることに費やされた。計算機は禁止されてた、「何も教えてくれないから」って理由で(でもスライドルールは教えてくれたの?当時は全然意味が分からなかったけど)。数年後には計算機がもっと受け入れられるようになって、18歳の数学のAレベルのクラスでは、どの科学計算機を買うべきかアドバイスされてた。TFAが言うように、面白いアナロジーだね。

スライド式計算尺は、対数スケールの仕組みを教えてくれるよ。

UVAで3単位を取るのに5000ドル以上かかることを振り返り、「このコースで自分が成長したとは思えない」とドリューは書いた。「自分の文章や思考においてわずかな改善しか見られなかった」と結論づけ、「不動産のファイナンスのように、自分のキャリアの目標について教えてくれる興味のあるコースにこの大金と時間を使いたかった」と言った。「もし文章を書く必要があるなら、AIが自分の目的に合った形で、はるかに安いコストで役立ってくれると思う。」なんか、これ、心に響くね。

資格(学位)の独占が原因なんだよね。英語のコースが5000ドルもするなんておかしいよ。500ドル以下でこの教材を教えられる人はたくさんいるのに、名のある資格を発行する権利がないんだ。いつか「自由市場が失敗する」って言ってる人たちが、最も高額な業界(医療と教育)が自由競争を許されていないって気づいてくれるといいな。

最近、大学生に英語を教える短期間の仕事をしたんだ。これは第二言語としての英語(あまり必要ないかもしれないけど)だけど、レベルは結構高かった。学生がAIを使うのを防ぐために、コースが急遽変更されたんだ。彼らは監督の下でエッセイを手書きしなきゃいけなくて、採点が本当に面倒だったよ。それから、期末試験の問題を見直すように頼まれたんだけど、サンプルテキストや文にちょっと変な表現があったんだ。文法的には完全に間違ってるわけじゃないけど、ちょっと変だったり意味がずれてたり。思い出すのは「…不均衡に男性と女性に影響を与える」っていう例だけど、他にももっとひどい例があったよ。どうなるかは想像できるよね。でも、リスニングテキストは別のネイティブスピーカーが書いたって知ってたから、直接批判したくなかったし、雑誌やコーパスから引っ張ってきたのかもしれないと思った。でも、もちろん、コースリーダーがチャットGPTで生成したんだよね。

「…不均衡に影響を与える…」の何が問題なの?正しい英語の構文のように思えるけど(COCAでの頻度は比較的低いけどね;72)。いくつかの例を挙げると:> 実際、ブラジル、アルゼンチン、ポーランドの最近のハイパーインフレのケースは、ハイパーインフレが貯蓄者に害を及ぼし、貧しい人々に不均衡に影響を与えることを示している(The Independent Review) > 木曜日に、州職員の給与増加を取り消す立法案の新しいバージョンに関する公聴会が設定されており、農村の立法情報オフィスに不均衡に影響を与えるセクションが削除されている(USA Today) > 自殺は男性に不均衡に影響を与える重要なメンタルヘルスの問題だ。(london.gov.uk)

テキストの「計算機が広く手頃な価格になったとき、数学の授業がどれほど根本的に変わったか想像してみてください」というフレーズについて、私は何が変わったのか知っている年齢なんだ。今、多くの大学生が基本的な計算に苦しんでいるよ。8桁の数字の長い割り算のことじゃなくて、2/10をパーセントで表現したり、1/1000を小数で書くときにゼロをいくつ使うかを知っていることなんだ。非常に優秀な学生でも、学部生や大学院生のレベルでこういうことに苦しんでいるのを見ると、心が痛むよ。

私は計算機が普及した後の世代だけど、これらの例は私や私の仲間には全く問題ないよ。だから、計算機が自動的にそのスキルの衰退を引き起こすわけじゃないみたいだね。