世界を動かす技術を、日本語で。

ほぼすべてのためのコーデックス

2026年4月17日原文(openai.com)

概要

Codex が大幅アップデート。 3百万人以上 の開発者が利用、ソフトウェア開発全体を強力支援。 PC操作・画像生成・記憶機能・自動化など多彩な新機能を搭載。 90以上の新プラグインと多様なツール連携を実現。 今後もさらなる進化を予定。

Codex大規模アップデートの主な特徴

  • PC操作 が可能となり、ユーザーと一緒に各種アプリやツールを操作
    • クリック・入力・アプリ利用 を自動化するエージェント機能
    • 複数エージェント が同時並行でMac上で動作、他アプリ作業を妨げない設計
  • 開発者向けワークフロー支援 の強化
    • PRレビュー、複数ファイル・ターミナル表示、SSH接続 対応
    • インアプリブラウザ でフロントエンド設計やゲーム開発の高速化
    • API非公開アプリ でも操作可能
  • Webとの連携強化
    • インアプリブラウザで ページ上に直接コメント し、詳細な指示が可能
    • 将来的にローカル以外のWebアプリも完全操作を目指す
  • 画像生成・編集機能 の追加
    • gpt-image-1.5 による画像生成・反復編集
    • スクリーンショット・コードと組み合わせた プロトタイプやデザイン作成
  • 90以上の新プラグイン を追加
    • Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite など主要ツール連携
    • PDF、スプレッドシート、スライド、ドキュメント のリッチプレビュー
    • 新サマリーペイン でエージェントの計画・ソース・成果物を一元管理

自動化・記憶・パーソナライズ機能の進化

  • 自動化機能の拡張
    • 既存の会話スレッドを再利用し 文脈を保持 したままタスク実行
    • 長期間タスク のスケジューリング・自動再開が可能
  • チーム利用 に最適化
    • Slack、Gmail、Notion などでのタスク管理や情報追跡に活用
  • メモリ機能(プレビュー版)
    • 個人設定、修正履歴、重要情報 の記憶・再利用
    • 次回以降の作業を 高速・高品質 に実行
    • プロジェクトやプラグインの文脈 をもとに「今日やるべきこと」や「再開ポイント」を自動提案
      • 例:Google Docsの未処理コメントを抽出、SlackやNotionから関連情報を集約、優先度付きタスクリストを提示

今後の展開と利用案内

  • ChatGPTアカウントでサインイン済みのCodexデスクトップアプリユーザー に順次展開中
  • パーソナライズ機能 (文脈認識提案・メモリ)はEnterprise、Edu、EU、UKユーザーにも近日拡大予定
  • PC操作機能はmacOS先行、EU・UKにも順次拡大
  • 未利用者・既存ユーザーともに、ワークフロー全体でのCodex活用を推奨

Codexの利用拡大と今後のビジョン

  • ローンチ1年で利用用途が多様化
    • コード作成、システム理解、コンテキスト収集、作業レビュー、デバッグ、チーム連携、長期作業の推進
  • AGIの恩恵を全人類へ というミッションのもと、
    • 想像と実現のギャップを縮める存在へ進化
    • 今後もツール・ワークフロー・意思決定支援 を強化予定

Hackerたちの意見

クロード4.7の後に何かを投稿しなきゃってプレッシャーを感じてたみたい。

もう数日前にリークされてたし、何週間も前から予告されてたよね。今週来るって言ってたし。

本当に人々はコーデックスに自分のコンピュータやアプリをコントロールさせたいのかな?セキュリティをしっかり保ちたいから、ちょっと不安なんだよね。

オープンクローを動かしてる人もいるから、確かに聞こえはおかしいけど、そういう人もいるよね。少なくともドッカーなしでモデルを動かすのはちょっと躊躇しちゃうな。

プログラマーはほとんどそうじゃないよね。普通の人はコンピュータの使い方を理解するのを障害だと感じてて、力を与えられてるとは思ってない。彼らはスタートレックを求めてる。「コンピュータ、次の休暇をXYZに計画して」って言って、完全な旅程を作って、チケットを買ったり予約したりしてくれるのを望んでる。知識労働は、ほとんどの人が本当に関わりたくない仕事なんだ。普通の人は、アイデアの洗練度に関わらず、あまり価値を置かないよ。

人々はそれを望んでないと思うけど、物事を進めるためには受け入れる準備があるんだよね。

私のMacの驚くべき権限の問題を修正してくれたよ。

それ、めっちゃわかる。私もAIのために手動でウィンドウをクリックしたり、コマンドを打ったりするバカな作業をしてる気がする。単純なタスクの同じ繰り返し作業が面倒で、どんどんイライラしてきてる。

UIには、コーダーからコードを隠すことに対するかなりの熱意があるみたい。プロンプトのやり取りが本当のソースで、実際のコードは面倒な中間ランタイムの不便さを隠すためのものって感じ。非開発者にとっては生産性が向上するのは分かるけど、「コード」って言葉を使うのが正しいのかはちょっと疑問。

ホットテイク:私たちは(私じゃなくて、ちょっと渋々だけど)コードが見えなくなった後もずっとそれをコードと呼び続けるだろうね。まるで、誰も電話しないのに電話って呼んでるみたいに。

そう、コードはまだ重要だよ。例えば、Codexにプログラミング言語で関数呼び出しを実装させたら、関数呼び出しのたびに新しいサブインタープリターを立ち上げて、標準ライブラリを読み込んで、コードを実行して、インタープリターを破棄してから続けるっていう方法を選んだんだ。すでにコメントの中にあった部分的でずっと効率的な解決策があったのにね。AIの解決策は「動いた」し、AIが書いたテストも全部通ったけど、すごく間違ってた。これがどうなってるか理解するためには、コードを見なきゃいけなかった。正しくするには、どう実装するかを示す必要があると思うけど、それにはプロンプト以上の専門知識が必要だよね。

現在の期待としては、非技術者向けの「プロフェッショナルエージェント」セットが、今までで最も重要で急成長する製品カテゴリの一つになると思ってる。つまり、ソフトウェアエンジニアじゃない知識労働者向けのエージェントだね。いくつかの考えや質問があるんだけど、 1. この製品群が多くのソフトウェアビジネスにとって非常に破壊的になると思ってる。新しいVPが会社に入ると、しばしば自分のお気に入りのソフトウェアベンダーに置き換えることがあるから。ほとんどのソフトウェアは人間ユーザーのために設計されてるけど、今度は人々のエージェントが彼らのためにソフトウェアを使うことになる。エージェントは人間とは異なるソフトウェアのニーズを持ってるから、必要なものもあれば、もう必要ないものもある。これがどうなるかっていうと、Googleがウェブページから抜粋や要約を取り出して検索結果の上位に表示するのと同じように、訪問数や広告収入を奪うような、もっと迅速で重要な変化のように感じる。 2. この分野で何十もの製品を試してきたけど、大半はオンボーディングが混乱してて、ユーザーは真っ白なスペースに放り込まれちゃう。使用制限もOpenAIやAnthropicが提供する補助トークンに比べて競争力がないし。競争が厳しい分野だけど、明らかに巨大な市場になるのは確実。マイクロソフトやグーグルからの大きな投資を期待してる。 3. この分野のスタートアップは、自社製品に合わせてモデルを訓練できるラボとどう競争するんだろう? 4. 最終的には、UIやインターフェースがモデルによってユーザー向けに生成・パーソナライズされるのかな?おそらくそうだよね。ハーネスがモデル生成のハーネスに食われる? ここに集めた考えもあるよ:https://chrisbarber.co/professional-agents/ 試した製品:dia、comet、chrome用のclaude、atlas、dexなどのAIブラウザ;openclaw、kimi claw、klaus、viktor、duet、atrisなどのclaw製品;taskletやlindyなどの自動化ツール;devin、claude code、cursor、codexなどのコードエージェント;vercept、nox、liminary、logical、raycastなどのデスクトップ自動化ツール;shortwave、cora、jaceなどのメール製品;もちろん、Claude Cowork、Codex cliとアプリ、Claude Code cliとアプリも。 編集:新しいCodexのアップデートを試した感想 1. パーミッションのワークフローがすごくスムーズ 2. バックグラウンドブラウザテストが良いし、シャドウカーソルは面白いUI要素だね。ただ、何回か前面で操作したり、フォーカスを取ったりもしてた。 3. アプリが新機能をデモするためのクイックな方法があればいいな。私のワークフローは、LLMにアップデートページを読ませて、新しいテストできることを聞いて、それをCodexにデモしてもらうって感じなんだけど、あまり自分の新機能を理解してないみたいで、うまく引き出せない(かなりの誘導が必要)。 4. アプリ内ブラウザを見せてくれない。 5. ウェブサイトの画像モックアップを生成して、それを構築するのはいいね。

Hacker Newsで議論の続きを見る