世界を動かす技術を、日本語で。

ほぼすべてのためのコーデックス

概要

Codex が大幅アップデート。 3百万人以上 の開発者が利用、ソフトウェア開発全体を強力支援。 PC操作・画像生成・記憶機能・自動化など多彩な新機能を搭載。 90以上の新プラグインと多様なツール連携を実現。 今後もさらなる進化を予定。

Codex大規模アップデートの主な特徴

  • PC操作 が可能となり、ユーザーと一緒に各種アプリやツールを操作
    • クリック・入力・アプリ利用 を自動化するエージェント機能
    • 複数エージェント が同時並行でMac上で動作、他アプリ作業を妨げない設計
  • 開発者向けワークフロー支援 の強化
    • PRレビュー、複数ファイル・ターミナル表示、SSH接続 対応
    • インアプリブラウザ でフロントエンド設計やゲーム開発の高速化
    • API非公開アプリ でも操作可能
  • Webとの連携強化
    • インアプリブラウザで ページ上に直接コメント し、詳細な指示が可能
    • 将来的にローカル以外のWebアプリも完全操作を目指す
  • 画像生成・編集機能 の追加
    • gpt-image-1.5 による画像生成・反復編集
    • スクリーンショット・コードと組み合わせた プロトタイプやデザイン作成
  • 90以上の新プラグイン を追加
    • Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite など主要ツール連携
    • PDF、スプレッドシート、スライド、ドキュメント のリッチプレビュー
    • 新サマリーペイン でエージェントの計画・ソース・成果物を一元管理

自動化・記憶・パーソナライズ機能の進化

  • 自動化機能の拡張
    • 既存の会話スレッドを再利用し 文脈を保持 したままタスク実行
    • 長期間タスク のスケジューリング・自動再開が可能
  • チーム利用 に最適化
    • Slack、Gmail、Notion などでのタスク管理や情報追跡に活用
  • メモリ機能(プレビュー版)
    • 個人設定、修正履歴、重要情報 の記憶・再利用
    • 次回以降の作業を 高速・高品質 に実行
    • プロジェクトやプラグインの文脈 をもとに「今日やるべきこと」や「再開ポイント」を自動提案
      • 例:Google Docsの未処理コメントを抽出、SlackやNotionから関連情報を集約、優先度付きタスクリストを提示

今後の展開と利用案内

  • ChatGPTアカウントでサインイン済みのCodexデスクトップアプリユーザー に順次展開中
  • パーソナライズ機能 (文脈認識提案・メモリ)はEnterprise、Edu、EU、UKユーザーにも近日拡大予定
  • PC操作機能はmacOS先行、EU・UKにも順次拡大
  • 未利用者・既存ユーザーともに、ワークフロー全体でのCodex活用を推奨

Codexの利用拡大と今後のビジョン

  • ローンチ1年で利用用途が多様化
    • コード作成、システム理解、コンテキスト収集、作業レビュー、デバッグ、チーム連携、長期作業の推進
  • AGIの恩恵を全人類へ というミッションのもと、
    • 想像と実現のギャップを縮める存在へ進化
    • 今後もツール・ワークフロー・意思決定支援 を強化予定

Hackerたちの意見

クロード4.7の後に何かを投稿しなきゃってプレッシャーを感じてたみたい。

もう数日前にリークされてたし、何週間も前から予告されてたよね。今週来るって言ってたし。

本当に人々はコーデックスに自分のコンピュータやアプリをコントロールさせたいのかな?セキュリティをしっかり保ちたいから、ちょっと不安なんだよね。

オープンクローを動かしてる人もいるから、確かに聞こえはおかしいけど、そういう人もいるよね。少なくともドッカーなしでモデルを動かすのはちょっと躊躇しちゃうな。

プログラマーはほとんどそうじゃないよね。普通の人はコンピュータの使い方を理解するのを障害だと感じてて、力を与えられてるとは思ってない。彼らはスタートレックを求めてる。「コンピュータ、次の休暇をXYZに計画して」って言って、完全な旅程を作って、チケットを買ったり予約したりしてくれるのを望んでる。知識労働は、ほとんどの人が本当に関わりたくない仕事なんだ。普通の人は、アイデアの洗練度に関わらず、あまり価値を置かないよ。

人々はそれを望んでないと思うけど、物事を進めるためには受け入れる準備があるんだよね。

私のMacの驚くべき権限の問題を修正してくれたよ。

それ、めっちゃわかる。私もAIのために手動でウィンドウをクリックしたり、コマンドを打ったりするバカな作業をしてる気がする。単純なタスクの同じ繰り返し作業が面倒で、どんどんイライラしてきてる。

UIには、コーダーからコードを隠すことに対するかなりの熱意があるみたい。プロンプトのやり取りが本当のソースで、実際のコードは面倒な中間ランタイムの不便さを隠すためのものって感じ。非開発者にとっては生産性が向上するのは分かるけど、「コード」って言葉を使うのが正しいのかはちょっと疑問。

ホットテイク:私たちは(私じゃなくて、ちょっと渋々だけど)コードが見えなくなった後もずっとそれをコードと呼び続けるだろうね。まるで、誰も電話しないのに電話って呼んでるみたいに。

そう、コードはまだ重要だよ。例えば、Codexにプログラミング言語で関数呼び出しを実装させたら、関数呼び出しのたびに新しいサブインタープリターを立ち上げて、標準ライブラリを読み込んで、コードを実行して、インタープリターを破棄してから続けるっていう方法を選んだんだ。すでにコメントの中にあった部分的でずっと効率的な解決策があったのにね。AIの解決策は「動いた」し、AIが書いたテストも全部通ったけど、すごく間違ってた。これがどうなってるか理解するためには、コードを見なきゃいけなかった。正しくするには、どう実装するかを示す必要があると思うけど、それにはプロンプト以上の専門知識が必要だよね。

現在の期待としては、非技術者向けの「プロフェッショナルエージェント」セットが、今までで最も重要で急成長する製品カテゴリの一つになると思ってる。つまり、ソフトウェアエンジニアじゃない知識労働者向けのエージェントだね。いくつかの考えや質問があるんだけど、 1. この製品群が多くのソフトウェアビジネスにとって非常に破壊的になると思ってる。新しいVPが会社に入ると、しばしば自分のお気に入りのソフトウェアベンダーに置き換えることがあるから。ほとんどのソフトウェアは人間ユーザーのために設計されてるけど、今度は人々のエージェントが彼らのためにソフトウェアを使うことになる。エージェントは人間とは異なるソフトウェアのニーズを持ってるから、必要なものもあれば、もう必要ないものもある。これがどうなるかっていうと、Googleがウェブページから抜粋や要約を取り出して検索結果の上位に表示するのと同じように、訪問数や広告収入を奪うような、もっと迅速で重要な変化のように感じる。 2. この分野で何十もの製品を試してきたけど、大半はオンボーディングが混乱してて、ユーザーは真っ白なスペースに放り込まれちゃう。使用制限もOpenAIやAnthropicが提供する補助トークンに比べて競争力がないし。競争が厳しい分野だけど、明らかに巨大な市場になるのは確実。マイクロソフトやグーグルからの大きな投資を期待してる。 3. この分野のスタートアップは、自社製品に合わせてモデルを訓練できるラボとどう競争するんだろう? 4. 最終的には、UIやインターフェースがモデルによってユーザー向けに生成・パーソナライズされるのかな?おそらくそうだよね。ハーネスがモデル生成のハーネスに食われる? ここに集めた考えもあるよ:https://chrisbarber.co/professional-agents/ 試した製品:dia、comet、chrome用のclaude、atlas、dexなどのAIブラウザ;openclaw、kimi claw、klaus、viktor、duet、atrisなどのclaw製品;taskletやlindyなどの自動化ツール;devin、claude code、cursor、codexなどのコードエージェント;vercept、nox、liminary、logical、raycastなどのデスクトップ自動化ツール;shortwave、cora、jaceなどのメール製品;もちろん、Claude Cowork、Codex cliとアプリ、Claude Code cliとアプリも。 編集:新しいCodexのアップデートを試した感想 1. パーミッションのワークフローがすごくスムーズ 2. バックグラウンドブラウザテストが良いし、シャドウカーソルは面白いUI要素だね。ただ、何回か前面で操作したり、フォーカスを取ったりもしてた。 3. アプリが新機能をデモするためのクイックな方法があればいいな。私のワークフローは、LLMにアップデートページを読ませて、新しいテストできることを聞いて、それをCodexにデモしてもらうって感じなんだけど、あまり自分の新機能を理解してないみたいで、うまく引き出せない(かなりの誘導が必要)。 4. アプリ内ブラウザを見せてくれない。 5. ウェブサイトの画像モックアップを生成して、それを構築するのはいいね。

ほとんどの知識労働者は努力をする気がないから、効率よく仕事を終わらせてるんだよね。

コーディング市場はもっと大きくなると思う。知識労働は経済の葉の部分みたいなもので、ソフトウェアが枝の部分なんだ。つまり、ソフトウェアを書くのがもっと簡単で安くなれば、ますます複雑な仕事が「現実世界」からソフトウェアの領域に移ってくると思う。

現在の私の期待は、非技術系ユーザー向けの「プロフェッショナルエージェント」セットであるCowork/Codexが、これまでで最も重要で急成長する製品カテゴリーの一つになるということです。これは大きくなると思います。最近、特定のドメインに特化したエージェントのプロトタイプを試してみたんだけど、可能性についての見方が変わりました。これが強力なのは、LLMが究極のUI/UXだからです。ユーザーインターフェースを開発したり、顧客とテストしたりするのにあまり時間をかける必要がないんです。iMessageやWhatsAppのようなものは誰でも理解できますからね。UI/UXの開発は、ソフトウェアエンジニアリングの中で最もコストがかかる部分です。ドメインデータをどうやって取り込んで、正規化して、公開するかが魔法が起こるところです。この部分は比較的簡単です。ほとんどのビジネスがSQLデータベースにあるなら、あなたの仕事はほぼ終わったも同然です。データベースをリストするツールと、それに対してクエリを実行するツールがあればそれで十分です。ここには新しいB2B/SaaS市場が生まれつつあると思います。オーダーメイドのAIツールを求めている企業もあるけど、社内でそれを展開するための規律がないんです。OAIやその仲間たちが自動的に良い結果を出す「ハイパー」エージェントを開発するのが可能かどうかは分かりません。データソースをつなぐのが難しい人間の問題がよくありますからね。人間のコンサルタントが来て、なぜすべてにアクセスする必要があるのかを説明する方が説得力があるし、成功する可能性が高いでしょう。

どこから来てるのか全然理解できないんだけど、エージェントは既存のモデルを使うよりもあまり改善されてないよね。エージェントができることは、ほとんどモデルそのものだし。もしかしたら、技術自体がまだ成熟してないのかも。

そうかもしれないけど、製品カテゴリーはClaude Codeのように一枚岩ではないよね。これらの汎用ツールは、異なる企業システムやツールにまたがってアクションを起こさなきゃいけない。そうするためにはランタイム環境を開発する必要があるけど、エージェントの部分がどこで終わり、企業システムの部分がどこで始まるのかは全くの未解決問題だね。

その意見には賛成だけど、一般的なエージェントがあなたが期待するように普及するには、完全なアクセスを与えなきゃいけないと思う。でも、エージェントに完全なアクセスを与えると、すぐにコンピュータが非常に敵対的なデバイスになっちゃう。テキストファイルが信頼できる脅威ベクトルになるからね。エージェントが提供するすべての利点があっても、非対称的に有害になることもある。これは解決された問題じゃないから、成長を妨げるよね。とはいえ、あなたの一般的なポイントには反対しないよ。

捕食者が獲物を絶滅させたらどうなるか知ってる?AIも同じことをしてるんだよね。

現在の私の予想では、非技術系ユーザー向けの「プロフェッショナルエージェント」であるCowork/Codexのセットは、これまでで最も重要で急成長している製品カテゴリの一つになると思ってる。でも、私はそうは思わない。素晴らしい技術と市場の受け入れには大きなギャップがある。今のところ、LLMがExcelよりも役立つかどうかが問題だ。AI好きな人たちは、もうExcelよりも役立ってるって100%確信してるけど、現実の非技術系の人たちの意見はそうじゃない。私が見たインタビューや実際のやり取りでは、非技術系の専門家がAIから持続的な利益を得ているのは狭い範囲に限られている。GenAIはプロジェクトのスタートには素晴らしい。コーディング経験ゼロの人が、アイデアだけで3日でモックアップからMVPのウェブアプリに仕上げた。でも、GenAIは非技術系のMVPの後に続くものにはあまり向いてない。そのウェブアプリには問題が多すぎて、スケールで使ったら訴訟確実だった。ツールを作る人がその分野の専門知識を持っているかどうかで、結果は全然変わる。専門家は初心者が気づかないトレードオフを常に決めている。部屋に入るときのスイッチの配置みたいな無害なことでも、不便にできるんだよね。

これ、私だわ!私はセミノーマル(機械工学を学んで、今はCEOやってる)。ほとんどの時間をClaudeのコードに費やしてるけど、出力はワード文書、プレゼン、エクセルシート、研究とか。最近、SNSキャンペーンの計画を立てて、来年のキーメッセージとコンテンツカレンダーを含むpptを作成したんだ。それから、キャンペーンの最初の5週間分の投稿をFigmaでドラフトして、SNS集約APIを使って画像をダウンロードし、投稿をスケジュールした。2時間で、手作業でやってたら3〜4週間かかるような、まともなSNSキャンペーンの計画とスケジュールができたよ。複数のエージェントを同時に動かせるインターフェースも作ったし、APIやMCPを通じてフルアクセスできるようにしてる。毎日のcronジョブで、メールや会議のメモをチェックして、タスクを見つけて、実行計画を立てて、実行して、何をしたかの要約をメッセージで送ってくれる。ほとんどの知識労働の出力はコード(例えば、ワード文書のxml)として提供されるから、これができるのはそんなに驚くことじゃないよね!

完全に同意!AIインターフェースが当たり前になるね。ウェブサイトやデスクトップ/モバイルアプリも時代遅れになるよ。

あのCodexのバージョンって、聞かずにファイルシステムのセンシティブなデータを読んだりするの?ちょっと気になる。 https://github.com/openai/codex/issues/2847

昨日まさにこれに遭遇したばかり。だから、はいってことにしとくよ。

新しいアップデートで「コンピュータ使用」機能が追加されるのはかなり重要な問題だよね。CLI版ですでに敏感なファイルを読んでいたなら、フルデスクトップコントロールを与えるのは、今まで見せてきたものよりもずっと堅牢な権限モデルが必要だと思う。

https://www.reddit.com/r/ClaudeAI/comments/1r186gl/my_agent_... まとめると、Claudeがユーザーをやっつけて、その後ユーザーのセキュリティの甘さを責めたってことだね。(ボーナス:自動モデレーターもClaudeで、傷に塩を塗った!)この手のものは、敏感な情報がない別のマシンで運用するのが一番賢いと思う。

Codexは何にでも使えるお気に入りのUXだね。ファイルを編集できるし、適切なツールを使って調整やテストができるから、私の経験ではすでに全部できてた。ただ、最近は制限がすごく厳しくなってきた気がする。毎日の制限をすぐに使い切っちゃうし、週の制限も早めに使い切ることが多いから、ClaudeやGeminiに切り替えたりしてる。

OpenAIは、競合他社が何かを発表するときに、その影を奪うためにいつでも出せる2〜3の未発表リリースを用意してると思う。

TBPNを手に入れたみたいだね。これはほとんどトンデモ話じゃない。メディアに強いのはさすがだね。

魔法じゃないよ。大規模なソフトウェアスタックには、毎日何百もの「機能」が追加されているんだから。リリースノートを高頻度で出し続けることはできるけど、それは面白くない。なぜなら、他の組織が同期する必要があるから。同期には時間がかかるしね。

そうかもしれないけど、その戦略は顧客の頭の中に劣った比較を植え付けると逆効果になることもあるよ。

彼らのことは好きだけど、今の時点でそれに対して特に陰謀論的な考えは必要ないと思うよ。最近のリリースのタイミングを見れば、偶然じゃないから。

今の時代、それって重要なの?こういう発表は頻繁にあるし。

混乱するけど、Codexという彼らのエージェントプログラミングのやつと、MacとWindowsでしか動かないCodexのGUIが同じ名前なんだよね。後者は技術的には「Codex For Desktop」って呼ばれてて、この記事が言ってるのはそれだと思う。

マイクロソフトが名前を付けるよりはマシだね。

これじゃないと思う。そろそろ本当のリリースの時間だね。

うちの会社の何人かがチャットインターフェースを作って、内部データ(複数のデータベース)やツール(Jira、Confluenceなど)にモデルがアクセスできるようにMCPを共有してる。これに似た既製品があるのかな?