世界を動かす技術を、日本語で。

ChatGPT利用者向けのGPT-4oの突然の非推奨化

概要

OpenAIはGPT-5の公開と同時に、ChatGPTの旧モデル(GPT-4oなど)の即時廃止を発表。 Redditなどで多くのユーザーがこの変更に不満を表明。 サム・アルトマンはユーザーの声を受け、Plusユーザー向けにGPT-4oの復活を約束。 新しいGPT-5は自動的に最適なモデルを選択する設計に変更。 API経由では旧モデルの利用継続が可能。

GPT-5リリースと旧モデル廃止の反響

  • OpenAI2025年8月7日 のリリースノートで GPT-5公開と同時に旧モデル(GPT-4o、GPT-4.1など)の廃止 を発表
  • ChatGPTの一般ユーザー向けアプリ旧モデルが即時利用不可 となる措置
  • 旧モデルを利用していたチャットは自動的にGPT-5相当のモデルへ切り替え
    • 4o、4.1、4.5などはGPT-5へ
    • o3はGPT-5-Thinkingへ
    • o3-ProはGPT-5-Pro(Pro/Teamユーザー限定)へ
  • 猶予期間なしでの切り替え により、 多くのユーザーがRedditで不満を表明
  • サム・アルトマン がRedditで「Plusユーザー向けにGPT-4oを復活させる」と発表

GPT-5の新設計とユーザー体験

  • GPT-5 の目的は モデル選択UIの煩雑さからの脱却
  • ユーザーがモデルを選ぶ手間を省き、プロンプト内容に応じて自動で最適なモデルを選択
  • 理論上は利便性向上だが、パワーユーザーからは反発
    • モデル選択の予測不能性 による 応答の一貫性低下
    • 有料ユーザーはGPT-5-Thinkingを直接選択可能
    • Ethan Mollick は「Thinkingモード」選択やプロンプト追加での誘導を推奨

GPT-4oへのこだわりと多様な利用スタイル

  • Redditユーザーの多くがGPT-4o廃止に強い不満
    • GPT-5は複雑な推論やコーディングに最適化
    • 4oは創造的コラボや感情的ニュアンス、長文・高コンテキスト対話に適していた
    • GPT-5の応答は従来の4oと異なり、創作や対話のスタイルに影響
  • 700万人以上の週次アクティブユーザーによる多様な使い方
  • 研究・コーディング・創作・実験など用途の多様性

ChatGPTの倫理方針と今後の展望

  • OpenAIの方針として「根拠に基づいた誠実な応答」を重視
    • GPT-4oは感情的依存や妄想傾向の認識が不十分なケースも
    • 「彼氏と別れるべきか?」のような高リスクな質問には直接答えず、思考を促す応答へ
    • この新しい応答方針は今後順次展開予定
  • 突然の機能変更は、既存ユーザーにとって喪失感や不便の原因
  • API経由では引き続き旧モデル利用可能
  • 一部ユーザーがAPI対応のサードパーティチャットサービスへ流れる可能性

今後の動向とまとめ

  • OpenAIはユーザーの声に応じてPlusユーザー向けにGPT-4oを一時的に復活
  • APIでの旧モデル提供は継続予定
  • モデル選択の自動化は今後のユーザー体験に大きな影響
  • 多様な利用スタイルに今後どう対応するかが注目点

Hackerたちの意見

追記:サム・アルトマンがredditのAMAで言ってたけど、人気の要望に応えてそれを再導入したみたい。 https://old.reddit.com/r/ChatGPT/comments/1mkae1l/gpt5_ama_w... 「5のリリースはコスト削減と、見た目を良くすることのどっちが大きかったんだろう。古いモデルを廃止する理由の一つは、5が運用コストがかなり安いからかな?他のモデルの価格を上げる方が良かったかも。アプリをしっかりテストする企業(みんなそうあるべきだけど)にとって、モデルを切り替えるのは結構大変なんだよね。」

APIで古いモデルを廃止するの? ドキュメントにはその兆候が見当たらないけど。

私もそれ気になってる。より良いルーターが効率を上げる(いいことだ!)一方で、コントロールを手放すことになると思う。OpenAIは導入したモードやトーンでこのシフトを緩和しようとしたけど、常に解決されない部分が残るよね。(例えば、まだdalle 2を使いたいな。)

APIのユースケースが壊れたわけじゃなくて、消費者向けのUIアクセスだけみたいだね。また設定の裏に隠れて許可されるようになるかもしれないし(異なるルートのGPT5レベルをセレクターに入れることも含めて)。

マージンって変だよね。維持コストが安いシステムが少し高く売れると、機会コストや純利益の懸念から兄弟モデルを食い潰しちゃう。未来の顧客のプールが不満を持った元顧客で混乱するまで、結構遠くまで行けるし。海外には不満を持った元顧客よりも、もっと潜在的な未来の顧客がいるから、南米に進出しよう!他のモデルの中で、同じ世代のハードウェアでうまく動くのはどれだろう?

Redditコミュニティから感じる雰囲気は、5は「何時間も楽しく会話しよう」って感じじゃなくて、「さっさと的確な答えを出そう」って感じだね。だから、仕事を効率的にするためにAIにお金をかけたいプロにはいいけど、できるだけお金を使わずにデータセンターの時間を使いたいカジュアルな人には悪いってことだね。

アプリを徹底的にテストしている企業(みんなそうすべきだけど)にとって、モデルを入れ替えるのはかなりの手間だよね。他人のAPIの上にビジネスを構築することの教訓がまた一つ。

「'5のリリースはコスト削減と見た目を良くすること、どっちが大きかったんだろう。古いモデルを廃止する理由の一つは、5が運用コストがかなり安いからじゃないかって推測してる。APIの価格がOpenAIの提供コストに関係してると仮定すると(これはちょっと推測だけど)、それは真実としてかなり支持されてると思う。モデルが導入された理由ではないかもしれないけどね。ChatGPTインターフェースから廃止されたモデルは、API上のGPT-5よりもかなり高い価格設定になってる。> アプリを徹底的にテストしてる企業(みんなそうあるべきだけど)がモデルを入れ替えるのは大変な作業だよ。ChatGPTのフロントエンドをモデルプロバイダーとして使ってるアプリって誰が作ってるんだろう?アプリは通常OpenAIのAPIに依存してるけど、そこではまだモデルが利用可能で、GPT-5は追加されて安くなってる。」

アプリをテストしてる企業は、ChatGPTアプリじゃなくてAPIを使ってると思うよ。モデルはまだAPI経由で利用できるしね。

vXからvX+1への移行を何度もやってきたけど、常に「最大限の後方互換性」と「理論上のすべての既存ユースケースをサポートすること」、そして「新しいやり方にみんなを移行させるためにスイッチを切り替えること」の間で緊張感がある。個人的には「最大限の後方互換性」派だけど、誰かがバンドエイドを剥がして新しいベストプラクティスを強制的に使わせるのは、ちょっとスカッとするよね。ワクワクする!でも、これって大事な機能をうっかり削除しちゃうことが多くて、騒ぎになって、結局急な移行が元に戻っちゃうことが多いんだよね。だから、デフォルトで最新バージョンに移行させつつ、古いバージョンも使えるようにして、切り替え率を監視して新しいシステムに欠けてる重要な機能を見つけるのが一番いいアプローチだと思う。

私は、限られた期間だけnとn-1の両方のバージョンを持つのがベストだと思ってる。指定した時点でn-1のバージョンを削除することを常に約束すれば、後方互換性の地獄にハマることはないよ。

このローンチには本当に混乱してる… 今日のほとんどの時間、私のアカウントにはgpt-5しかなかったのに、今は前の選択肢(私の好みのo3も含めて)に戻っちゃった。gpt-5は引き下げられたの?それとも、ただのプレビューだったのかな?

私も同じだよ。

これ。プラス会員だけど、5は全然見えないよ。

プラス会員で、iOSアプリには5しかないよ。

プラス会員で、iOSアプリにはGPT-5しかないけど、ウェブインターフェースには昨日の発表以降、旧モデル(4.5より古い高コストのやつ以外)しかないよ。

チームアカウントがあって、友達はアプリにGPT-5があるけど、ウェブサイトにはないんだ。一方で、私はウェブサイトにはGPT-5があるけど、アプリにはまだGPT-4oしかない。混乱してるっていうか、もうどうしようもないよ。

iPhoneにはgpt-5が入ってるけど、iPadには入ってない。どっちも最新のchatgptアプリを使ってるのに。デバイスごとに展開してるのかな?でも、個人的にはそれって変なやり方だと思う。

私の場合、あるノートパソコンでは今日利用できたけど、もう一台ではダメだった。どちらも同じアカウントでPlusにログインしてるのに。

デスクトップアプリにはあるけど、ウェブやモバイルにはない。展開の仕方が本当に変だね。

o3はスピードとレスポンスの質、価格とパフォーマンスの面で異常だったよね。基本的なウェブ検索をするのに、o3 proを使うと5倍時間がかかるのに、レスポンスはあんまり良くならなかった。今のところ、GPT-5の思考には感心してないけど、まだ具体的に理由は言えないな。同じプロンプトをo3とGPT-5で並べて比べてみようと思ってる。あと、最初の数時間使った感じだと、短いプロンプトにはo3ほど強くない気がする。例えば、大きなxmlやjsonのプロンプトを使う代わりに、タスクに対してできるだけ短いフレーズを入力する感じ。「家庭用LLM推論に最適なGPU vs クラウドAPI」とかね。

今までのチャットは君のと似たような感じで、全体的にo3より悪いし、良くなったことはないよ。完全に誤解されたケースもあって、他のフロンティアモデル(o3、Sonnet、Gemini Pro)ではそんなことなかったから、すごく変な体験だった。もちろん、間違いはあったけど、何を聞いてるかを完全に誤解することはなかった。SonnetとGeminiで同じプロンプトを試したら、どちらも正しく理解してくれた。ソフトウェアアーキテクチャに関することだったから、得意なはずなんだけど。なのに、なぜかエンドユーザーの視点からの質問だと解釈されちゃった。人間や他のモデルには明らかだったのに、開発者の視点だってことが。

GPT-5は、いくつかのことに関しては本当にダメだよ。最初に頼んだのは、渦巻き模様のダマスカスナイフの画像を出してもらうことだったんだけど、ちゃんとした画像は出してくれたけど、持ち手が直角に二つあったんだ。次に、持ち手が一つだけの同じ画像を頼んだら、持ち手のピンを一つ外したけど、ナイフにはまだ二つの持ち手が残ってた。こんな多機能ツールの新バージョンが、前のバージョンよりも悪いケースがあるのは驚きじゃないけど(最初のタスクで失敗したなら、そのケースが本当にどれほどのものだったのか疑問だよね)。だから、みんなを一斉に切り替えるのは良くないと思う。旧チャットGPTはそのプロンプトに問題なかったし、こんなに複雑なものなら、新しいバージョンに悪い挙動があるのも驚きじゃない。だから、旧モデルをそんなに早く廃止するのはやめた方がいいと思う。

画像モデル(GPT-Image-1)は全く変わってないよ。

なんか君のプロンプトをコピーしたら、初回でハンドルが一つのナイフができたよ:https://chatgpt.com/s/m_689647439a848191b69aab3ebd9bc56c 編集:chatGPTがシェアリンクをコピーしたときに、プロンプトを英語からポルトガル語に翻訳した。

画像モデルは文字通り同じモデルだよ。

そうだね、最悪だよ。でもGPT-4も同じ問題を抱えてると思う、同じ画像モデルを使ってるからね。

GPT-5の画像に関して何か変なことが起きてるかもしれないね。OpenAIはライブ配信でその話を避けてたし。SMBCのアーティストは、GPT-5が彼のスタイルを模倣するのが上手くなったって言ってたよ:https://bsky.app/profile/zachweinersmith.bsky.social/post/3l... でも、基盤となる画像モデル(gpt-image-1)には更新がないみたい。ただ、GPTがトークンを生成して、それを画像モデルがデコードする自己回帰的な性質のために、基本のLLMトークン生成器の更新で新しい画像をトレーニングデータとして取り入れることが可能なんだ。下流の画像モデルをその画像でトレーニングする必要はないからね。

感情のニュアンスって、どうやってテストするのか分からないな!まぁ、これは簡単だよ。数十年前から分かってたことだし。君の誕生日。誰かが君に子牛の革の財布をくれる。君には小さな男の子がいる。彼は蝶のコレクションと殺虫瓶を見せてくれる。テレビを見ていると、突然、腕にスズメバチが這っていることに気づく。

V-Kテストについて考えたことがなかった視点があるんだけど、映画の設定では動物はほぼ絶滅寸前なんだよね。見える動物の命はレプリカントのようにエンジニアリングされたものだけ。テストは動物への共感についてだと思ってたけど、映画の世界ではすべてのシナリオが重大な違反なんだってことに気づかなかった。カーフスキンの財布は、ただの悪趣味じゃなくて、珍しくて不気味なんだ。全然関係ない話だけど、考えさせられたよ。

余談だけど、「deprecate」を「シャットダウン」と同じ意味で使うのは避けた方がいいよ。何かがdeprecateされたら、それは使わない方がいいってことだから。例えば、Cライブラリのgets()関数はセキュリティリスクがあるからdeprecateされたけど、12年後まで削除されなかった。区別が重要なんだ。もしGPT-4oを使っててそれがdeprecateされてたら、何もしなくていいけど、もしシャットダウンされたら、問題になるからね。

この記事はこのサブレディットにリンクしてるんだけど、今まで聞いたことなかったよ:https://www.reddit.com/r/MyBoyfriendIsAI それにしても、恐ろしいフォーラムだね。ここの人たちがやってることは健康的とは言えないよ。これが歴史上最も広がったメンタルヘルスの問題の一つになるかもしれない。

Raycastで4oからGPT-5に切り替えたけど、正直言って5の方がすごく遅く感じる。彼の主張とは矛盾してるよね。Raycast AIを使ってると、もっと早い回答を期待しちゃうよ。

GPT-5は4oに自動モデル選択機能がついただけだね。