アプリ SDK

2025年10月7日原文(developers.openai.com)

概要

Apps SDK は現在プレビュー提供中で、開発者がアプリの構築やテストを開始可能。年内に アプリ提出 が可能となる予定。 ChatGPT にネイティブな体験を提供するデザインガイドラインが公開。品質・安全性・ポリシー基準を満たすための 開発者向けガイドライン も用意。サーバー構築からデプロイ、最適化、セキュリティまで幅広いガイドを提供。

Apps SDK プレビュー概要

Apps SDK は現在 プレビュー提供 中
開発者が アプリ開発・テスト を今すぐ開始可能
年内にアプリの 公式提出受付 を開始予定
ChatGPT に最適化された デザインガイドライン を公開
品質・安全性・ポリシー 準拠のための 開発者ガイドライン 提供

アプリ設計とガイドライン

ChatGPT に自然に溶け込む 会話フロー と デザインコンポーネント 設計
デザインガイドライン で一貫性と高品質なUXを実現
開発者ガイドライン で 品質・安全性・ポリシー の基準を明確化
公式ガイド を参照し、要件を満たすアプリ開発を推奨

開発プロセスとサーバー構築

ユースケースの調査・優先順位付け による開発計画
MCPサーバー のセットアップ・構成方法をガイド
サーバーデプロイ 手順の詳細な解説
Apps SDK の導入から運用までの全体的な流れ

最適化・セキュリティ・トラブルシューティング

メタデータ最適化 による発見性と動作向上
セキュリティ・プライバシー に関する考慮事項
トラブルシューティングガイド で開発時の課題解決を支援

Hackerたちの意見

これ、すごく面白いと思うけど、Phind 2で作ったものを思い出すな。あの時は、答えに動的なプリビルドウィジェットが含まれてた。だけど、このアプローチの問題は、アプリやウィジェットがハードコーディングされた入力と出力のスキーマを持ってることなんだ。ウィジェットの能力の範囲内でユーザーが質問すれば、うまくいくこともあるけど、実際の使用ではその脆さがすぐに現れてくる。たとえば、Zillowでより高度なフィルターを使いたいとか、StreetEasyとクロスリファレンスしたい場合はどうするの？もしウィジェットのハードコーディングされたスキーマがその機能をサポートしてなかったら、ユーザーはお手上げだよね。もっとワクワクするのは、生成的なUIの回答をその場で完全に作り出せる能力だと思う。Phindからも近いうちにこれについてもっと話す予定だよ（私が創業者だから）。

└

Phindは素晴らしいよ。レガシーな検索エンジンが何度も検索しても見つからない時に、使うのを忘れがちだけど、Phindは大体見つけてくれる。ただ、1年前はもっと使ってたな。最近は、普通のLLMを使ってるけど、検索が上手くなってきたから。

└

すでにMCP-UIプロジェクトがあるから、できるのは驚かないけど、それが正しいアプローチだとはあまり納得できないな。結局、実際の使用にはまだまだ遅すぎるから…。

└

copilot kitのAG-UIがこの分野にいるのは知ってるけど、MCPモデルとはうまくいってないと思うよ。

└

問題は、能力の制限そのものではなく、発見可能性なんだよね。ユーザーは、追加されたり、イライラすることに削除されたりする能力が何かを知らない。Google Assistantがその典型的な例だよ。会話型ユーザーインターフェースは不透明で、使いやすさが欠けてるんだ。

└

ああ、それは面白いね。うちの製品でも似たようなものを作ろうと思ってるんだけど、君が言ってたスキーマの制約に対する解決策として、ウィジェットをできるだけユニバーサルなブロックに分けて、役立つものにしようと思ってるんだ。まだアイデア段階だけど、モデルがタスクに応じて相互運用可能なコンポーザブルウィジェットの範囲から選べるようにできるかなって考えてる。具体的な例を挙げると、検索結果のリストを一つの結果や、結果を比較するためのマトリックス、さらにフィルターセクションに分けられるような感じ。だから、現在のコンテキストの異なる側面をリクエストして、検索セッションを繰り返しながら結果とやり取りできるんじゃないかな。まだ調査中だけどね。Phindでの経験について、どこかに書いたことある？

└

もしその機能がウィジェットのハードコーディングされたスキーマにサポートされていなければ、ユーザーとしては運が悪い。チャットとプリビルトおよびオンデマンドウィジェットが組み合わさることで、この制限に対処している。例えば、キーノートデモでは、チャットインターフェースが複数のソースから情報を集めて高度なフィルタリングを行う様子が示されていた。例えば、犬公園の近くにあるZillowの物件だけをフィルタリングするような感じ。

最近、OpenAIの組織におけるチャットインターフェースの深い浸透についての投稿があったね。これがさらに強調されてるけど、実際にこんなに言葉でやり取りするのって、視覚的な要素より好きな人いるのかな？それに、アプリの名前を「zillow」とか覚えておいてチャットに打ち込むのが嫌だなって思う。これって、アプリの広告を徐々に導入する機会みたいなもので、「優先的な発見」っていうか、マネタイズ戦略としてね。個人的には、そんな未来は望んでないな。

└

どの投稿のこと？

└

本当に同意するよ。チャットインターフェースの支配が、これらのツールの一般的な有用性を大きく損なってると思う。早くなくなった方がいいよね。エンジニアじゃない人に、連続した会話の幻想がコンテキスト管理を通じてどう作られているか、そして会話の過去の瞬間がなぜ記憶から消えるのかを説明するのはほぼ不可能だよ。非技術的な友達には、各プロンプトごとに新しい会話を作るようにアドバイスしてる。そうすれば、指示の作り方や成功するものがより明確に分かるから。AppleがUXの面で何か革新をしてくれることを本当に期待してたけど、まだ全然だね。

└

GUIとターミナルのどちらが強力かの議論を繰り返してる気がする。トークンの流れにきれいに一般化できる多くのタスクに関しては、コマンドラインやチャットの方が優れてると思う。特定のボットやmCPエンドポイントの名前を思い出すのを助けるために、タブの自動補完みたいな便利機能も出てくるだろうけど…でも、発見を伴うタスクには、グラフィカルなインタラクションの方が直感的だし、そのタスクに関連した特別なインターフェースが必要になると思う。トークンの流れを抽象化するために、部分的に隠れたレイヤーがあるかもしれない。

└

反論として、周りの多くの人は「zillow」をグーグルで検索してアクセスしてるから、チャットインターフェースで名前を使うのもおかしくないかもね。

Hacker Newsで議論の続きを見る

ハクソク