クロード・ソネット5

2026年7月1日原文(anthropic.com)

概要

Claude Sonnet 5 は、従来モデルよりも高いエージェント性能を実現
Opus 4.8 に近い能力を持ちつつ、コストは低価格
安全性 ・不適切な挙動の減少・サイバーセキュリティリスクの抑制を強化
2026年8月末まで 特別価格で提供、API経由で利用可能
実運用での評価 も高く、複雑な業務自動化やコーディング支援に最適

Claude Sonnet 5の特徴と進化

最もエージェント的 なSonnetモデルとして設計
計画立案・ツール利用・自律実行 が可能
Sonnet 4.6 より推論力・ツール利用・コーディング・知識作業で大幅向上
Opus 4.8 に匹敵する性能ながら、コストは大幅に低減
安全性評価 で不適切挙動が減少、エージェント用途での利用も安全性向上
サイバーセキュリティ能力 はOpusクラスより控えめ、悪用リスクを抑制

提供プランと価格体系

全プラン （Free、Pro、Max、Team、Enterprise）で利用可能
Claude Code や Claude Platform でも提供
2026年8月31日まで ：入力100万トークンあたり$2、出力100万トークンあたり$10の特別価格
2026年9月以降 ：入力$3、出力$15に移行予定
API経由 での利用もサポート

エージェント用途での実際の活用例

複雑な業務の自動化 や マルチステップのソフトウェアエンジニアリング に強み
Salesforceアカウント更新・メール送信 などの一連業務を自律的に完遂
バグ調査・テスト作成・修正実装・検証 まで一括実行
作業効率化 と コスト削減 を両立
保険・法律・データ分析 など多様な業務で導入実績

安全性とサイバーセキュリティ対応

悪意あるリクエスト拒否・プロンプトインジェクション耐性 が向上
幻覚・イエスマン的応答 の発生率が減少
自動行動監査 でもSonnet 4.6より安全性が高い
サイバーセキュリティタスク は一部対応するが、悪用防止のため能力は限定
サイバーガードレール を標準搭載、危険な用途をリアルタイムで検知・遮断

技術的注意点・移行時のポイント

トークナイザー更新 により、同じ入力でもトークン数が1.0～1.35倍に増加
レートリミット引き上げ で高負荷利用にも対応
移行コストはほぼ中立 となるよう価格設計

Claude Sonnet 5の今後の展開

Cyber Verification Program 対応、AWS・Azure・Anthropic等で提供
セキュリティ用途 はOpus 4.8推奨
関連アプリ （Claude Science、Claude Tag）との連携拡大
グローバル展開 として韓国オフィス開設・パートナーシップ強化

まとめ

Claude Sonnet 5 はコストパフォーマンスと安全性を両立した次世代エージェントAI
多様な業務自動化・コーディング支援 に最適
今後もセキュリティ・機能拡張 を進め、幅広い分野での活用が期待

Hackerたちの意見

新しいHaikuはいつ出るの？4.5が出てからもうほぼ1年経つし、ちょっと古くなってきたね。

└

あのレベルの知能ならQwenを見てみて。

また素晴らしいアップデートが来たみたいで、いいね！最近はほとんどのコーディング作業でOpusの代わりにSonnetを使ってるよ。タスクを分けるのにちょっと手間はかかるけど、ほぼ同じクオリティでお金もかなり節約できるよ。

└

うん、Sonnetみたいな小さいモデルや速いモデルを見落としてる人が多いと思う。詳細な計画があったり、小さくて範囲が明確なタスクなら、Sonnetでも十分実行できるよ。Opusはもっとオープンエンドなタスクや完全に「雰囲気コーディング」には向いてるけどね。Opusで仕様や計画を立てて、Sonnetに実装させるのもアリだね。

うわ、GLM 5.2よりも価格/パフォーマンスが悪いみたいだね。GLM 5.2は744bパラメータなのに。システムカードからの情報だと、「CyberGymの脆弱性発見に関して、Claude Sonnet 5はSonnet 4.6よりも能力が劣っていて、Opus 4.8やMythos 5には遥かに及ばない。ここでの評価はすべての安全策をオフにした状態で得られた結果です。デフォルトの対策を使った場合、Sonnet 5はCyberGymで0点を取った。」

└

ようやく実現可能なビジネス戦略ができたね。セキュリティを無視したコードモンキーを安く売って、その後、問題を片付けられるエージェントには高い料金を取るっていう。

└

あなたを特別扱いするつもりはないけど、親コメント者さん、HNの議論の質がこういう基本的な比較を超えて進展することを本当に願ってる。どのモデルのリリーススレッドも同じコメントばかりだよね。「XモデルはTベンチマークでClaude ZモデルよりY%良いか悪い」「それは関係ない、ただのベンチマックスだ」「日常のコーディングやエージェンティックな作業には使えない、雰囲気が完全に違う」「ほぼ同じだけど、ずっと安いから絶対使う」「これを使う正当性を見出すのは難しい、オープンモデルのコストが下がっても生産性の損失を補えないから」私は不満を持つAnthropicの顧客で、オープンモデルや非ゲートキープの知能を応援してるけど、今のミームのようなモデルリリースの議論からどうやって進めるのかはわからない。LLMやベンチマークを設計するわけじゃないし、情報を提供しようと頑張ってる人たちには本当に感謝してるよ、たとえ完璧じゃなくてもね。こういうコメントページを積極的に読んでる人たちも同じように感じてるんじゃないかな？

└

GLM-5.2とSonnet 4.6で記事を書き直してみたけど、結果は全然違った。LLMは非決定的だからね。でも、GLM-5.2は微妙なミスをたくさんして、手で修正しなきゃいけなかった。一方、Sonnetは二回目で全てのミスを見つけて修正してくれた。プランニングやコーディングでも似たような状況だった。GLM-5.2は「紙の上では」良さそうだけど、実際の使用結果は全然違った。私はClaudeやGLM-5.2の弁護士じゃないけど… :) 2022年11月から毎日LLMモデルを使ってきて、すべての一般的なテストは自分のプロジェクトで確認しなきゃいけないって気づいた。「一つのモデルが全てを支配する」なんてことはないし、何千ものモデルの中から特定のモデルを見つけ出さなきゃいけない。ベンチマークは役立つけど、車の広告の燃費スペックみたいに、実際の消費は人それぞれ違うからね :)

評価によると、現在のOpusモデルよりもサイバーセキュリティタスクをこなす能力がかなり低いとのこと。なんでこんなことを自慢するんだろう？人々がサイバーセキュリティタスクをこなすためにモデルを使いたがっているのを知っていながら、その能力を意図的に奪っているみたいだね。それに、Opus 4.8は合格率が高いのにまだ安いから、Sonnetを使う理由がよくわからない。グラフを見る限り、低い労力で、たぶん些細なタスクにしか使わないつもりなんだろうけど、50%の確率でしか動かしたくないなら、他のモデルに切り替えた方がいいよね。価格設定が全然意味不明だよ。

└

Lutnickがまた文句を言わないようにね。

└

数ヶ月間Mythosを盛り上げてきたのに、結局禁止されちゃったね。彼らは自社製品を差別化しつつ、規制当局にもアピールしたいんだろうね。

└

それでブロックされないんだ。前回、あるモデルがサイバーに強いって言われた時は、あんまりうまくいかなかったし。

Hacker Newsで議論の続きを見る

ハクソク