世界を動かす技術を、日本語で。

AIの使用増加に伴い、バークレーのコンピュータサイエンスクラスで成績不振が急増し、数学スキルが低下

概要

  • 2026年春のUC Berkeleyのコンピュータサイエンス科目で 異常に高い落第率 が発生
  • 主な要因は AI依存、数学力不足、スタッフ不足
  • 教員は 成績評価方法の見直し や学生支援の強化を検討中
  • 学生の 授業・オフィスアワーへの参加率低下 も顕著
  • 今後は より実践的な教育と基礎学力向上 が課題

UC Berkeley CS科目の落第率急増

  • 2026年春、 CS 10の35.3%CS 61Aの10.6% がF評価
    • 過去2年は いずれも10%未満
  • 学科ガイドラインでは 下級生科目のD・F率は7%以下 が目安
  • 平均GPAは 2.3(C+) で、ガイドライン(2.8–3.3)を大幅に下回る

AI利用と学力不足が主因

  • Dan Garcia教授によると、 AI(Claude、ChatGPT、Google Gemini等)依存による不正行為増加 が主因
    • CS 10で 約30名がカンニングで摘発
  • 数学的基礎力の不足も深刻
    • Gireeja Ranade准教授も EECS 127で16.8%がF評価 (通常の3倍以上)
    • 線形代数などの基礎科目で AI利用許可 が学力低下に影響

成績評価方法と教育方針

  • Garcia教授は 相対評価(カーブ)を否定 し、絶対基準の公開と再挑戦機会の提供を重視
  • A評価に人数制限を設けない方針 を支持
  • Ranade准教授は、 スタッフ不足のため最終プロジェクトを廃止
    • TA減少・CS履修者数制限 も進行中

学生の授業・オフィスアワー参加率低下

  • オフィスアワーの参加者激減
    • 以前は満員だったが、今学期はほぼ無人
  • 授業外での学習意欲の低下 が顕著

今後の対策と教授陣の展望

  • Garcia教授は 学期初日に2026年春の事例を周知 し、 補習支援の強化 を計画
  • Ranade准教授は AI時代に必要な思考力・分析力の育成 を重視
    • ACT・SATスコアのSTEM入試復活 を求める署名にも参加
  • 難問に取り組む姿勢40年先を見据えた人材育成 の重要性を強調
    • 混乱は学びの汗」という姿勢を推奨

Hackerたちの意見

なんて曖昧なタイトルなんだ。「xyzの後に成績が急上昇」って言うと、xyzが以前はひどかった成績を良くしたみたいに聞こえるよね。

AIが記者の仕事を奪った後、失敗ニュースの見出しが急増してる。

この曖昧さは「クリックベイト」にするための一部かもしれないね。どの意味についてなのか気になって、もっと読みたくなるから。

この子たちにはちょっと同情するな。もしLLMが学生の頃にあったら、俺も宿題を「早く終わらせる」ために使って、テストは全部落ちてたと思う。今は、どの学問環境でもトップだった博士たちと一緒に働いてるけど、彼らの思考力も急速に落ちてるのが見える。多くの人が、ブレインストーミングやコーディング、深く考えること、LLMなしでの執筆ができなくなってる。自分一人で30分静かに考えることすらできない人が多いし、これはオリジナルな考えを生み出すために必要なスキルなんだよね。大人の場合、認知の低下は測定しにくいけど、LLMの助けがあるから全体のアウトプット量は問題ないだろう。でも、これが周りのあちこちで起こってるのは確かだと思う。正直、最初は否定したかったけど、今は無視できないくらい明らかだよ。

自分は石のように頭が悪くて、博士号も持ってないけど、約1年前から少しずつ手動でコーディングや数学をやるようにしてる。特に「認知機能の低下」を感じるわけじゃないけど、昔はルーチンだったことが今は重く感じるようになって、すごく「怠け者」になったなって思う。

これは社会が通過しなきゃいけない調整期間だと思う。今の電子機器の使い方を見ていると、数年後にはタバコを吸うのと同じように見られるかもしれない。そして、「低下」の多くは、過去にもっと重要だったスキルから、今の世代が測定したり認識したりしない別のことへのシフトによるものだと思う。

LLMはカンニングを発明したわけじゃなくて、ただそれを簡単にしただけ。カンニングをすると、自分自身を裏切ることになる。教育の目的は学ぶことであって、課題を終わらせたりテストで高得点を取ることだけじゃない。誰も得をせず、カンニングで実質的に傷つくのは自分だけ。学ぶためには脳を適応させる必要があるけど、それは挑戦やストレスを通じてしかできない。筋肉と同じようにね。eスポーツをして体を鍛えることができないのと同じように、LLMを使って宿題をやって学ぶこともできない。機械に考えさせることが、脳にとってタバコを吸うのと同じくらい健康に良くないことを認識するのは、多くの人にとって難しい調整になるだろう。賢い学生はLLMを監督者として使ったり、挑戦やフィードバックを提供するために使うべきで、簡単なボタンとして使うべきじゃない。敵対的または編集ツールとして使えば、学習にとって素晴らしい道具になる。未来は、自分をより効率的にする方法でツールを使おうとする人たちに属する。効率的なツールを使って働かなくて済む人たちには属さない。

今の教え方を逆転させることにメリットがあるのか考えてる。以前は下から教えて、徐々に積み上げていくスタイルだった。セミコロンはここ、波括弧はあそこ、そしてアーキテクチャやシステムに至るまで。でも、誰かが手元にLLMを持ってそのトピックに来たとき、これは意味がないように思える。彼らは高レベルの技術、アーキテクチャ、ベストプラクティスなどを知る必要がある。トピックを追求する中で詳細に入っていくけど、完全に独立してできるようにはならないだろう。この考え方は好きで、今の状況から前向きな道を描いているように思える。

自分自身がAIを過剰に活用し始めたときにこれを観察した。以来、どんなタスクに使うかをもっと慎重に考えるようになったけど、まだ失敗することもある。執筆に関しては、カスタムGPTやClaudeプロジェクトで自分の過去の本を知識として持っているものを使ってプロットラインをブレインストーミングするのは素晴らしい。段落や章を書いてもらうのは、自分の執筆スキルやモチベーション、語彙、プロットラインを把握・記憶する能力が急速に低下しているのを感じるので、もうそれには使わない。勉強に関しては、いくつかの夜間大学のコースを受講していて、素晴らしいと思ったのは、自分で問題を考え抜いて、毎回の講義で自分のノートを取るようにしていること。ChatGPTに概念を説明してもらったり、理由を考えてもらったりすることはあるけど、回答をドラフトするように頼むことは拒否している。プログラミングに関しては、これが難しい。問題やコードベースにあまり個人的に投資していないと、Claudeに多くの部分をオフロードするのが簡単になってしまう。会社が「バイブを合わせて」速度を上げることを奨励していると、質の低いPRが増えて、投資が減る。自分がほとんど理解している解決策をコミットすることもあるし、残りは手を振っているだけ。大きな部分は職場文化の問題だと思う。自分のプロジェクトでは、各タスクの計画者としっかり理解し合うようにしているし、最初の計画を自分で書くこともある。コードを生成する際には、特に興味があり知識がある部分(自分の場合はバックエンド)を正しくレビューするのがはるかに簡単だと認めざるを得ない。フロントエンドはあまり詳しくないし、興味もあまりないので、「まあ、動くからコミットしちゃおう」となってしまうこともある。リリース前に徹底的な品質チェックをするつもりで。これらすべてにおいて、エージェントにオフロードしすぎると、自分の思考力、計画力、推論力、集中力(そして語彙)が低下するのを感じる。自分にとって、そのバランスを保つことは、自分の長期的な脳の健康を維持することと、良い成果を出すことの両方に関わっている。AIと共に育つ若い人たちは、より能力のある(自分の意見では)脳の状態がどういうものかを知らないだろう。彼らにとって、AIを使う脳が普通になるだろう。

このままだと、人間はLLMにリモートで操作されるアバターになっちゃうね。意識の議論の皮肉な結論。

逆に、助けを求めに行った回数と、教育的に失敗した経験、そして友達のように家庭教師を雇う余裕がなかったことを考えると、LLMにアクセスできていたら本当に成績が上がったと思う。まあ、そこそこ良い成績は取ったけど、インターネット以外で助けてくれる人がいなかったギャップがあったんだよね。

自分の能力が落ちてるとは全然感じないな。20年前に大学を卒業したけど、かつての数学のスキルは5〜10年でかなり落ちちゃった。頭の中で素早くできた簡単な算数やパーセンテージが、今では計算機やスプレッドシートに頼るようになった。他の雑学的な知識は、ポケットの中のインターネットにオフロードしちゃった感じ。質問が出てきたときに「そういえば、前は知ってたな、調べてみよう」と思うのが普通になってる。もしかしたら、LLMが登場する前に自分のバカさ加減の限界に達してたのかも。でも、コミュニケーションの状態にはすごいメンタルの負担を感じてる。今の時代は、同時に何百万ものスレッドや会話を juggling しなきゃいけないから。メール、ボイスメール、チャット、オンライン、テキスト、プライベート、仕事、家庭、子供、他の家族、友達、さらにMessages、Messenger、WhatsAppみたいなバリエーションもあって、もう圧倒される。自分が知ってる人たちよりも、すごく繋がりが薄いと感じる。ニュースやスポーツはほとんどフォローしなくなったし、もうそれに使える余裕がないんだ。自分の脳はインターネットが登場する前に作られたもので、アナログからデジタルへの変換が限界に達してる気がする。もしくは、ただ本当にロスの多いプロセスなんだろうね。

最近、テスラから古い車に戻ったんだけど、地図が常に見えるわけじゃない。急にルートを考えなきゃいけなくなって、脳がまたもっと努力しなきゃいけない感じがする。

役割によって大きく変わると思う。私はシニアソフトウェアエンジニアだけど、私が使っているLLMはほとんどの作業を改善してくれる。今ではほとんどのコードを書くのにLLMを使ってるけど、まず20年間はLLMが登場する前にコードを書いてたし、コードを書くのは仕事の5%くらいなんだ。私の仕事の大半は研究、調査、アーキテクチャだから。LLMをジュニアエンジニアみたいに扱ってる。自分が一人でできる明確に定義された仕事を与えてるんだ。何年もやってきたことだからね。問題は、学生が自分が上達する前にLLMを使ってすべてを自動化してしまっていること。大学生に宿題でLLMを使わせるのは、幼稚園児に指で数える代わりに計算機を使わせるようなものだよ。

関係ないニュースだけど、「カリフォルニア大学の教員600人以上が、UCバークレーの数学者たちの主導で、科学、技術、工学、数学の応募者に対して標準化テストの要件を復活させるよう求めている。6年間のテストなしの入学が準備状況を信頼できる形で評価していないとし、教授たちは新入生に中学校の数学を教えていることが多い。」

おそらく「本当の」理由は記事の中の一段落に隠れていて、目を引くタイトルの意味とは関係ないんだ。「ガルシアとラナデは、UCシステムのSTEM入学のためにACTとSATの標準化テストのスコア復活を求める請願に署名した1,300人以上のUC教員の一員だ。この請願とそれに伴う公開書簡は、学生の数学的準備に関する同様の懸念を詳述している。」COVIDの時期に多くのトップ大学が入学要件からテストを外す実験をしたけど、それは主に公平性に関連する理由だった。どこでも失敗していて、多くの大学がすでに元に戻している。イェールが言ったように、「イェールの研究は、パンデミック前後を通じて、すべての出願要素の中で、テストスコアが学生の将来のイェールの成績を最もよく予測する要因であることを一貫して示している。これは、家族の収入や他の人口統計変数を考慮に入れた後でも当てはまり、ACTやSATだけでなく、APやIBの科目ベースの試験にも当てはまる。」そのリンクはアーカイブ用で、そのページは削除されている。新しい「テスト柔軟」戦略を試していたからで、学生にテストスコアを提出するかどうかを選ばせていたけど、それをすぐにやめて、単純にテストスコアを要求する形に戻ったんだ。

2021年に標準化テストが廃止されたのが本当の理由なら、なんで今突然失敗率が急上昇してるんだろう?

バークレーの学長が学生に2020年のカリフォルニア州の提案16に投票するように言ったんだけど、これは1996年の提案209を繰り返すもので、公立大学の人種に基づく入学を禁止するものだった。提案16は失敗した。その後、カリフォルニアはSAT/ACTのスコアを無視し始めた。これって、アジア系の学生を減らすための代替手段だったんじゃないかと思う。アジア系の学生は平均的に一番高いスコアを取ってるからね。すぐ後に、同じ学長からメールが来て、その変更が人種の多様性を増やすためのものだと褒めてた。メールにはアジア系の割合が減って、他の人種が増えた前後の数字が含まれてた。

私はアメリカ人じゃないから、もしかしたら背景がわからないかも。でも、テストスコアなしで入学はどうやって機能してたの?

残念だな。最近、数学を再学習するために面白い活動を始めたんだ。問題を解きながら、ジェミニのライブモードに確認や提案を求めて、時にはステップバイステップで進めてる。すごく楽しかったよ、まるでとても忍耐強い教授が隣にいるみたいだった。今までで一番の数学学習体験の一つで、ジェミニに贈り物や賄賂を送る必要もないんだ。ただ、LLMに完全に仕事を終わらせてもらうよう頼むと、自分自身で考えずにやるのはズルい気がする。

さらに、ガイドラインには「下級課程の典型的なGPAは2.8〜3.3の範囲に収まる」と書かれています。2026年の春には、バークレータイムによると、両クラスの平均成績はCプラスで、GPAは2.3に相当します。カリフォルニア大学の卒業生として、成績のインフレを抑えているのを見て本当に嬉しいです。自分が達成したGPAを得るために一生懸命働いたので、カリフォルニアが例えばイェールのように79%のAやAマイナスを配り始めたら、自分の努力が無駄になってしまうのは本当に嫌です。

人気のない意見だけど、公立大学をアカデミックなハンガーゲームにするのは、存在する目的に真っ向から反すると思う。教育を受けた市民を育てることが目的なのに、意図的に授業の質を下げたり、試験で学生をつまずかせようとするのは、誰の教育成果も良くしない。成績のインフレについて文句を言う人たちは、公教育がそもそも存在する理由を完全に見失っている。

数学のスキルは、LLMが登場する前から徐々に落ちてきてたと思う。話があるけど、これはあくまで個人的な体験だから、軽く受け流してね。フランスで物理を学んでいた3年目の時、2人の先生の会話を聞いたんだ。彼らは、1年目のプログラムに数学を含めるべきだって話してて、ますます多くの学生が物理やニュートン力学のような数学が多い科目で落ちているのを気づいていたみたい。彼は、1年生に微積分を教えるべきだと言ってたけど、私が大学に入った時には教えられてなかった(高校で習っている前提だったから、1年生では線形代数だけを扱うことになってた)。今は、学生が自分で数学を学ぶ前に、ツールを使ってできるという幻想に陥っているから、状況はさらに悪化していると思う。これって、計算機を使うことに適応したように、プログラムも適応すべきなのかな?

AIと教育の組み合わせは本当に面白いけど、正しくやるのは結構難しいね。今、正しい方向に向かっていることを願って取り組んでるプロジェクトがあるよ: https://knowable.ca

僕が主に使ってるのは、思考をつなげるためにZettelkastenを使うことだね。これがAIを使った情報収集と相性が良くて、つながりができるたびにシナプスが活性化する感じ。Tiago Forteの方法を使って、必要に応じてゆるいオーガナイズモードの中で原子ノートを整理してるよ。

僕の経験(n=1)だと、確かに特定のタスクでは怠けちゃうけど、AIのおかげでもっと複雑なタスクに挑戦できるようになった。まだAIに任せられないタスクもたくさんあるけどね。僕が扱ってるコードベースが結構複雑で数学的な要素が多いからかもしれないけど、全体的には簡単なタスクでは怠け気味になりつつ、難しいタスクでは視野が広がったって感じだね。