世界を動かす技術を、日本語で。

GPT-2: 公開するには危険すぎる (2019)

概要

  • GPT-2はGPT-1の直接的なスケールアップ版で、パラメータ数と学習データ量が大幅に増加
  • OpenAIは悪用リスクを懸念し、当初GPT-2の完全公開を控えた
  • GPT-1とGPT-2の主な違いはパラメータ数と学習データ量
  • GPT-2は多様なタスクで最先端の性能を発揮
  • ChatGPTではGPT-2の教訓を活かし、悪用防止策を強化

GPT-2の登場と公開制限

  • GPT-2GPT-1 のスケールアップ版として開発
  • パラメータ数や学習データ量が大幅増加
  • OpenAIは「悪用の懸念」から 完全な学習済みモデルの公開を見送り
  • 代わりに、 小規模モデル技術論文 のみを公開
  • GPT-1は無制限に公開されたが、GPT-2はその強力さが議論を呼ぶ結果に

GPT-1とGPT-2の違い

  • 両モデルともトランスフォーマーのデコーダー構造 を採用
  • 主な違いは パラメータ数学習データの量・多様性
  • GPT-2の最大モデルは1.5Bパラメータ(GPT-1の10倍)
  • 学習データは約 40GBのWebテキスト
  • これらの強化により、 言語理解やタスク適応力が向上
  • アーキテクチャ自体は大きく変わらず、 規模拡大による性能向上 が主

GPT-2の技術的特徴と公開経緯

  • GPT-2には 4つの構成 が存在
  • 最大構成は 48デコーダーブロックd_model=1600
  • オリジナルのTransformerは 6ブロック、d_model=512 だったため、GPT-2は桁違いの規模
  • 大規模モデルの訓練自体が技術的成果
  • 公開から9ヶ月後、 1.5Bパラメータ版のモデルとコードを公開
  • OpenAIは 責任ある公開基準の議論 を継続

GPT-2公開後の知見とリスク

  • GPT-2の出力は人間にとって非常に説得力が高い
  • 悪用目的でのファインチューニングが可能
  • 検出は困難 (例:RoBERTaによる検出率約95%)
  • 現時点で 深刻な悪用事例は確認されていない
  • バイアス研究の基準作りが必要
  • OpenAIは早期から リスクと対策の重要性 を認識

GPT-2とChatGPTの比較・今後の課題

  • ChatGPT はGPT-2の知見を活かして 悪用防止策 を強化
  • 例えば、「なりすまし」などの悪用を未然に防ぐ機能を実装
  • しかし、 宿題の自動生成 など新たな悪用は依然として課題
  • AIによる不正利用の検出 は今後ますます困難に
  • 教育現場や社会全体でのAI活用・規制の議論 が不可欠

参考文献

  • GPT-1: Generative Pre-Trained Transformer (2018)
  • GPT-2: Better Language Models and Their Implications 論文・コード
  • OpenAI ChatGPT: Optimizing Language Models for Dialogue

Hackerたちの意見

まるで100年前のことみたいだ。

次は中国からのウイルスかな?何もないのに大騒ぎだね。

「技術の悪用に関する懸念から、訓練されたモデルを公開することはありません。」彼らは間違っていなかった。今やこの技術を悪用している産業がたくさんあって、そのせいでRAMやディスクの価格がめっちゃ上がった。 - RAM、GPU、ディスクの価格が高騰 - スロップが普通になった - 人々はAIで文書を書いたり、AIで読んだり、AIで返事をしたりしている - 学生はAIで宿題をやってるし - 面接を受ける人もAIを使ってカンニングしてる - 大量のメールをAIで送信してる - TikTokやインスタ、YouTubeにはさらに意味不明な動画が増えた - などなど...

振り返ってみると、彼らは完全に正しかった。人間の著作と区別がつきにくい低コストのコンテンツ生成が引き起こす社会的な被害は天文学的だよ。もっと馬鹿げた終末的なシナリオを考えなくても、この技術が生まれなければよかったと思う。

もちろん、モデルファイルへのアクセスを制限しても、ホスティングされたモデルへのアクセスがあれば、この被害はまだ起こり得る。

社会がどう変わるか想像するのが難しいからって、進歩を止めたくない。生きている間にスター・トレックのような経済/社会を見たいんだ。人生は一度きりだからね。ちなみに、AI/LLM/機械学習はロボティクスへのゲートウェイ技術で、これからもっと影響が出るよ。

もう、あのいわゆる指導者についてのAIミームには耐えられないよ。偽のボディビルダーみたいな神秘感なんてさ…ほんと、その通り。こういうのは心理的にダメージが大きいし、アメリカの「親友で同盟国」が行っているジェノサイドから目を逸らさせる大きな distraction だよ。心が痛むし、ひどいプロパガンダだ。もうやめてくれよ、十分に盗んだり殺したりしたんじゃないの?今は昔のアメリカ西部じゃないんだから、通信手段も少なくて孤独なサバイバルの話じゃない。これは組織的なナチス風の殺戮、指揮、管理で、ボタンを押したり引き金を引いたりする人たちの肩の罪悪感を軽くするために「AI」なんて名乗ってるだけだよ。

低コストのコンテンツ生成は、2018年から2026年の間に発展途上国の約50%がモバイルインターネットにアクセスできるようになるから、どうせ来てたと思うよ。ソーシャルメディアも特定のタイプのコンテンツを促進してるし(マネタイズ)。でも、AIは確かに助けにはなってないね。

これによってどれだけの社会的ダメージが出たんだろう?反AI派の人たちの立場が理解できなくて、本当に困ってる。なんか、漫画みたいに見えるよ。

逆に、これで人々がネットから離れて、対面での交流をもっと大切にするようになるかもしれないね。私はソーシャルメディアのスクロールをやめたし、存在しない偽の風景や偽の食べ物、偽の都市を見るのに疲れちゃった。

振り返ってみれば、彼らは完全に正しかった。確かに、連続詐欺師のサム・アルトマンが「リリースするには危険すぎる」と言った時、彼が言いたかったのは、規制当局に自分のために人工的な競争の障壁を作ってもらいたかったってことだよね。連続詐欺師のサム・アルトマンは金儲け以外には何も気にしてないし、倫理なんて全く気にしてない。だから、連続詐欺師のサム・アルトマンの会社は、著作権のある教科書や作品を無断で使ってモデルを訓練したんだ。自分にはルールが適用されないってわけ。連続詐欺師のサム・アルトマンは、社会が崩壊しても気にしない。だって、彼は超金持ちだから法律や結果なんて関係ないんだよ。

インターネットにアクセスできない国では、人口のIQが爆発的に上がるだろうね。

2019年当時は、より大きなGPT-2モデルに対して慎重になるのが妥当だった。なぜなら、2019年の基準での堅牢なテキスト生成は完全に未知だったから。2026年のMythosのようなもので、今はより良いLLMの社会的影響が理解されているので、その危険性の宣言をマーケティングのギミックと呼ぶのが妥当だ。

これがどうしてギミックなの?ソフトウェアエンジニアリングを解決する方法なんて、想像もつかないレベルで職業が変わるよ。

これは自然なフォローアップの質問だね。フロンティアラボや企業が、本物として見られるためにどんなエスカレーションやメッセージを発信すればいいのかな?マーケティングのギミックじゃないって思われるために。

うん、Anthropicは人々がCodexに移行するのを喜んでるだろうね。素晴らしいマーケティングだよ。

残念ながら、AnthropicやClaudeのモデルは、議論の信号対雑音比が底を突いたマインドキラーな話題の仲間入りをした。

これはマーケティング戦略だったと思う。

昔は誰もこれらのツールをコーディングに使おうなんて考えてなかったのが面白いよね。今は、Mythosの周りのハイプは主にセキュリティの脆弱性についてだけど、元のGPT-2の投稿ではコーディングについて一度も言及してない。おそらく「危険」はスパムコンテンツや誤情報だったんだろうね。

あの頃はエージェンティックループも確立されてなかったし、ツールコーリングはもっと後になってからだったから…そうだね、ただの可能性じゃなくて、ほぼ確実にそうだよ。

たとえReActの論文が2019年に発表されたとしても、GPT-2はツールコーリングアプローチで実際に機能するほど堅牢じゃなかったと思う。ファインチューニングしても、通常のコーディングにはGPT-2はほとんど役に立たなかったから、結局Redditに投稿されたリンクからしか訓練されてなかったしね。

それについてはほとんど考えが変わってないな。あの時は明らかに早すぎたけど、どのモデルが危険か事前に判断するのは難しいから、正しい姿勢だったと思う。むしろ、この厳格さが次のリリースに進化していればよかったんだけど、残念ながら2019年のOpenAIはもうないね。

おもしろいね。2036年から戻ってきたClaudeのことを想像してみて。

「リリースするには危険すぎる」っていうオチにみんなが飽きたら、「大きすぎて潰せない」って言い出すかもね。あ、待って、それは2008年にすでに考案されてるか。