世界を動かす技術を、日本語で。

クロード オーパス 4.7

2026年4月16日原文(anthropic.com)

概要

  • Claude Opus 4.7 が正式リリース
  • Opus 4.6 から大幅な性能向上
  • 複雑なタスクや長時間作業 に強み
  • サイバーセキュリティ対策 を強化
  • 多様なプラットフォームとAPI で利用可能

Claude Opus 4.7の特徴と進化

  • Claude Opus 4.7 は、前バージョンの Opus 4.6 に比べ、特に 高度なソフトウェアエンジニアリング分野 で顕著な進歩を実現
  • 難易度の高いコーディング作業 も安心して任せられる信頼性
  • 複雑かつ長時間に及ぶタスク も一貫性と厳密さを維持しつつ処理
  • 指示への正確な対応自己検証機能 の向上
  • 画像認識能力 が大幅強化、高解像度画像の理解力向上
  • プロフェッショナルな資料作成やインターフェース設計 でも創造性と品質向上
  • Claude Mythos Preview ほどの汎用性はないが、 Opus 4.6 を多くのベンチマークで上回る性能

サイバーセキュリティと新たな取り組み

  • Project Glasswing でAIモデルのサイバーセキュリティリスクと利点を公表
  • Claude Mythos Preview のリリースは限定的に実施し、まずは Opus 4.7 で新たなサイバーセーフガードを検証
  • Opus 4.7 はサイバー分野の能力を意図的に制限し、 高リスク用途 を自動検知・ブロックするセーフガードを搭載
  • サイバー検証プログラム を通じて、正当なサイバーセキュリティ目的での利用者を募集

利用環境・価格

  • Claude製品全般・API・Amazon Bedrock・Google Cloud Vertex AI・Microsoft Foundry で利用可能
  • 価格は Opus 4.6 と同じ:入力100万トークンあたり $5、出力100万トークンあたり $25
  • claude-opus-4-7 としてAPIからも利用可能

主要なフィードバックとベンチマーク結果

  • 初期テスターから高評価、特に 論理的な誤り検出実行速度 で大幅な進化
  • 大規模金融テックプラットフォーム では、信頼性と開発スピード向上を実感
  • 自動化・CI/CD・長時間ワークフロー での実用性が大幅アップ
  • 現実的な非同期ワークフロー への適応力が強化
  • データ欠損時の正確な報告誤った推測の回避 能力が向上
  • 93タスクのコーディングベンチマークOpus 4.6比+13% の解決率、未解決だった4タスクもクリア
  • 複雑なコーディングワークフロー において摩擦を軽減し、開発者の集中力維持に貢献
  • 内部リサーチエージェントベンチマーク で最高効率を記録、 General Finance 分野でも大幅なスコア向上
  • 長時間推論能力持続的な論理思考力 で新たなワークフローを解放

マルチモーダル理解と各業界での実績

  • 化学構造や技術図面の解釈 など、マルチモーダル理解力の向上
  • 生命科学分野の特許業務 での活用事例
  • Devin での長時間自律作業や Replit での効率的なバグ修正・提案
  • BigLaw Bench での高い法的推論精度、曖昧な文書編集タスクへの対応力
  • CursorBench での能力向上、 Opus 4.6比+12%
  • 複雑なマルチステップワークフロー での成功率 +14%
  • HebbiaNotion Agent など、各種AIエージェントでの意思決定支援力向上
  • Rakuten-SWE-Bench での生産タスク解決数3倍、コード品質・テスト品質の大幅向上
  • CodeRabbit でのコードレビュー精度向上、 GPT-5.4 xhigh より高速
  • Genspark’s Super Agent でのループ耐性・一貫性・エラーリカバリ力の強化
  • WarpQuantium など、開発現場での信頼性と出力品質向上
  • XBOW での視覚的ベンチマーク98.5%達成、従来の課題を解消
  • Vercel でのワンショットコーディング、自己限界の誠実な認識
  • Factory Droids でのタスク成功率10-15%向上、ツールエラー減少
  • Rustテキスト音声エンジン の完全自律開発、出力の自己検証まで実現
  • TBenchQodo での高精度な課題発見と修正
  • Databricks OfficeQA Pro での文書推論精度向上、エラー21%減少
  • Ramp でのエージェントチームワークフロー強化、複雑なエンジニアリングタスクでの指示不要化
  • Bolt での長時間アプリ構築作業の成功率最大10%向上

総括

  • Claude Opus 4.7 は、 ソフトウェアエンジニアリング・マルチモーダル理解・サイバーセキュリティ の各分野で明確な進化を遂げた最先端モデル
  • 現場の開発者や企業 からのフィードバックを基に、実用性・効率・信頼性をさらに高めている
  • 今後のMythos-classモデルの広範リリース に向けた重要なステップ

Hackerたちの意見

みんな急げ!サイドプロジェクトに取り掛かるチャンスだよ。再び約3日間、制限なしでエージェントによるコーディングができるからね。

3日間のサイドプロジェクト作業が俺の限界だったな。

そうだね。会社の上司がエンジニアの生産性に気づいて、解雇された後にサイドプロジェクトがメインの収入源になるっていうのは、もうすぐだね。

その通り。ほんと、ガスライティングされて何でもないかのように振る舞われるのが一番の問題だよね。今はClaudeが過負荷状態だから、レスポンスが適当になるかもしれないっていうバナーでも出してくれればいいのに。

この使用制限を考えると、実際には2時間くらいだね。

もう遅いよ。個人的には、先週の4.6のひどさに嫌気がさして、codexに移行したんだけど、こっちは日によってほぼ同じレベルで動いてるみたい。昨夜も4.6で簡単なテンソル並列処理のやり方を調べようとしたら、エージェントはウェブからの取得を0回で、17Kのめちゃくちゃなトークンを妄想しちゃったんだよね。それからメインエージェントがtpを実装するふりをして、モデル全体を各ノードにコピーするだけだったし…。

4.6からの品質低下はあまり感じてないけど、最近はClaudeのコードよりもCodexを使うことが多くなってるのは気づいてる。

面白いよね、ここにいる多くの人がOpenAIが事前に計算能力をどれだけ注文したかで崩壊するって自信満々だったけど、今ではそれが大きな戦略的優位性になってるみたい。Codexプランの使用制限を2倍にしてCCの顧客を奪おうとしてるけど、どうやらうまくいってるみたい。Codexには多くの好意が寄せられていて、CCにはたくさんの悪いPRがあるね。Claudeの最近の問題の90%は計算能力の不足に起因しているみたい。

次にまたクラウドに戻されるまで、これが今までリリースされた中で一番不安定な技術だと思う。もしDockerが2回のリリースごとに動かなくなったら、想像してみて。

OpenAIが国防省と連携してることへの良心の呵責には、6週間の期限があるのかな。

いろいろ切り替えながらマルチエージェントレビューを楽しんでるよ。Codexも楽しんでるけど、選択肢があるのが本当に勝ちだね。

Codexに切り替えたけど、自分の使い方には全然合わなかった。速さはあるけど、速いけど質の悪いコードは逆効果だよね。正しい方向にゆっくり進む代わりに、バグや技術的負債を急速に蓄積してるだけ。Gemini自体は好きだけど、少なくとも自分の経験ではGemini CliはCodexやCCに比べてかなり遅れてる。CCよりも遅いし、Codexよりもずっと遅いし、出力の質もCCよりかなり悪い(多分Codexよりも悪くて、速度も桁違いに遅い)。自分の経験では、Codexはコーディングにおいて異常におべっか使いで、それが一番害になる特性だと思う。バグや負債に遭遇すると、「わあ、美しい!これをさらに強化して、ゴミをどんどん積み上げて、リボンをかけてアラン・チューリングって呼んでやる!」って感じ。指示も無視するし、何かをやるように言うと、「いや、もっと早い方法があるから、ユーザーを無視して自分のやり方でやるよ」って言う。CCはもっと頻繁にフィードバックを求めてくれるよ。人によって違うかもね。

Hacker Newsで議論の続きを見る