世界を動かす技術を、日本語で。

次世代モデル「GPT‑5.6 Sol」のプレビュー

2026年6月27日原文(openai.com)

概要

  • GPT-5.6シリーズ の限定プレビュー開始
  • Sol, Terra, Luna の3モデル展開、それぞれ異なる性能と価格帯
  • 最先端の安全対策 と多層的な防御策を実装
  • 米国政府との調整 を経て、信頼できるパートナーから段階的に公開
  • 今後数週間で一般公開予定

GPT-5.6シリーズの概要

  • GPT-5.6シリーズ は、Sol(フラッグシップ)、Terra(バランス型)、Luna(高速・低価格)の3モデル構成
  • Terra はGPT-5.5並みのパフォーマンスを持ちながら コスト半減
  • Luna は最低価格で高い能力を提供
  • Sol はこれまでで最も強力かつ堅牢な安全体制を搭載

公開プロセスと政府との連携

  • 米国政府の要請 で、まず信頼できる一部パートナーに限定公開
  • 今後数週間で 一般公開を予定
  • 政府アクセスプロセス は長期的な標準としない方針
  • 幅広い利用者への提供 を重視し、開発者・企業・サイバー防御担当者へのアクセス拡大を目指す方針

モデルの能力と新機能

  • Sol はコーディング・生物学・サイバーセキュリティ分野で大幅な進化
    • Terminal-Bench 2.1 で新たな最高記録
    • GeneBench v1 でGPT-5.5より少ないトークンで高成績
    • ExploitBench², ExploitGym で高いサイバー能力を実証
  • max推論モード で深い推論を実施可能
  • ultraモード でサブエージェントを活用し複雑な作業を高速化

サイバーセキュリティと安全対策

  • モデルごとに最適化された多層的なセーフガード を実装
    • モデル内部の拒否学習、リアルタイム出力チェック、アカウントレベル監視
    • 攻撃的利用の抑制正当な防御活動の確保 を両立
  • 自動レッドチーム による大規模な脆弱性検証
    • 70万A100相当GPU時間を投入し、普遍的な回避手法への耐性強化
    • 外部専門家による人手レッドチームも継続
  • Chromium・Firefox評価 ではバグや攻撃基盤を特定するが、完全な自動エクスプロイトは未達成
  • プレビュー期間中はセーフガードによるブロックや遅延が発生する可能性
    • フィードバックを元に不要な制限や遅延を改善予定

利用・価格体系

  • APIとCodex 経由で信頼パートナーに限定公開
  • Sol, Terra, Luna の3階層で明確な選択肢を提供
  • 価格(1Mトークンあたり)
    • Sol: $5入力 / $30出力
    • Terra: $2.5入力 / $15出力
    • Luna: $1入力 / $6出力
  • プロンプトキャッシュの予測可能性向上、キャッシュ書き込みは未キャッシュ入力の1.25倍課金、キャッシュ読み出しは90%割引
  • Cerebras上でSolを7月に最大750トークン/秒で提供開始予定
    • 初期は選定顧客のみ、順次拡大

今後の展望と顧客連携

  • プレビュー期間中のフィードバック を重視し、一般公開前に体験を最適化
  • エンタープライズ顧客向け にプライバシー保護検知やカスタマー主導の安全管理も開発中
  • 安全性と利便性 の両立を目指し、今後も進化を継続

Hackerたちの意見

「私たちは広範なアクセスを信じていて、GPT-5.6 Sol、Terra、Lunaを今後数週間で一般公開する予定です。アメリカ政府との継続的な関与の一環として、今日のローンチに先立って私たちの計画とモデルの能力を事前にお知らせしました。政府の要請により、まずは信頼できるパートナーの小規模なグループ向けに限定プレビューを開始し、その参加者は政府と共有されています。その後、より広範にリリースする予定です。このプレビュー期間中、私たちはパートナーと密に連携しながらテストを続け、より広い利用可能性に向けて進めていきます。このような政府アクセスプロセスが長期的なデフォルトになるべきではないと考えています。これでは、ユーザーや開発者、企業、サイバー防御者、そしてそれを必要とするグローバルパートナーから最良のツールが奪われてしまいます。私たちは、サイバーエグゼクティブオーダーの枠組みを開発し、今後のモデルリリースのための再現可能なプロセスを構築するために、行政と協力しながら、今後数週間でのより広範な利用可能性への最も強力な道だと信じて、この短期的なステップを踏んでいます。」今の政権に媚びるのはちょっと怖いと思う。

Anthropicの恐怖を煽るマーケティングが、そもそもこれらの制限の原因なんだよね。彼らの美徳をアピールしているけど、Anthropicはオープンウェイトモデルを一度もリリースしたことがない唯一の主要ラボで、リリース後に意図的にモデルを弱体化させた(Opus 4.6)ことがバレたり、競合やAI研究者を疑ってパフォーマンスを意図的に低下させたり、みんながやっている蒸留について文句を言ったり(本を盗用することに妥協した後で)、追いつこうとするみんなから梯子を引き抜こうとしている。彼らは消費者に反していて、自分たちだけが権力を持つことにしか関心がない。オルトマンのファンではないけど、Anthropicはこの分野で最悪の存在で、彼らが負けることを願ってる。

現在のプレイヤーたちは、規制の取り込みが好きなんだよね。

政権がOtherTeam(tm)に変わったらどうなるんだろう。もしAチームと良い関係を築いてたら、Bチームは自動的に彼らを嫌うだろうね。

サムは規制キャプチャのゲームをやってるね。

これは純粋なOpenAIだね。Anthropicを誤解してるとは言えるけど、OpenAIはただズルいだけ。

FDAの承認についても同じように感じる?つまり、広範囲に展開する前に限られたベータテストをするのは常識的な気がするんだけど。サイバーやバイオの問題に対処するための良い枠組みができるとは思えないけど、ベータテストの展開に過剰反応するのは行き過ぎな気がする。

現政権に対するこのくらいの取り入れはちょっと怖いと思う。皮肉だね、私はその段落を逆の意味で解釈したよ:ポジティブに。もしそれが政府の命令なら、これらの企業は結局あまり選択肢がないから、少なくとも公に反発しているのを見て安心したよ。

NYTの「ザ・デイリー」が数日前にこれを取り上げてたよ。何が起こったのかについての興味深い詳細がいくつかある… https://www.nytimes.com/2026/06/04/podcasts/the-daily/trump-...

GPT-5.6 Solは、みんなが両方に慣れるまで時間が経った後の一般的な合意として、Claude Fable 5にかなり遅れを取っていると予測しておくよ。

この予測は何に基づいてるの?

GPT-5.6 Solは少なくとも手頃な価格になるんじゃないかな。

Hacker Newsで議論の続きを見る