クロード・ソネット 4.6

2026年2月18日原文(anthropic.com)

概要

Claude Sonnet 4.6は、従来モデルを大幅に上回る多機能AI。コード生成、長文推論、PC操作など幅広い業務に対応。 1Mトークンのコンテキストウィンドウを搭載し、大規模データにも強み。安全性・堅牢性も向上し、ビジネス利用に最適。コストパフォーマンスは業界トップクラス。

Claude Sonnet 4.6の全体像

Claude Sonnet 4.6 は、これまでで最も高性能なSonnetモデル
コード生成、PC操作、長文推論、エージェントプランニング、知識作業、デザイン など幅広い分野に対応
1Mトークンのコンテキストウィンドウ （β版）を搭載し、大規模なコードベースや契約書、研究論文も一度に処理可能
Free・Proプラン のデフォルトモデルとしてclaude.aiとClaude Coworkで提供
価格はSonnet 4.5と同等 （$3/$15/100万トークン）

コーディング能力の進化

一貫性や指示の理解力 が向上し、開発者から高評価
Opus 4.5 にも匹敵、または上回るパフォーマンスを実現
長時間のコーディングセッション でもストレスが少ない操作感
バグ検出や大規模コード検索 においても高い解決率

PC操作スキルの向上

OSWorldベンチマーク で継続的なスコア向上
Chrome、LibreOffice、VS Code など実際のソフトウェア操作を人間同様に実行
複雑なスプレッドシート操作や多段階フォーム入力 も人間レベルに近づく
プロンプトインジェクション などの攻撃に対する耐性も強化
OSWorld-Verified で評価基準をアップデート

ベンチマーク・実務評価

Claude Code でのユーザー満足度はSonnet 4.5より約70%高い
Opus 4.5 との比較でも59%のユーザーがSonnet 4.6を支持
長期的な計画や複雑な業務 で高い推論力を発揮
Vending-Bench Arena で独自戦略を展開し、競合モデルを圧倒
OfficeQA、保険ベンチマーク など各種業務で最高水準の精度

デザイン・フロントエンド・分析力

フロントエンドコードや財務分析 で顧客から高評価
レイアウト、アニメーション、デザイン感覚 が向上
少ないイテレーションで生産品質に到達
iOSコード生成 でRakuten AIからも高評価
契約ルーティングやCRM連携 など分岐・多段階業務に強み

セーフティ・堅牢性

包括的な安全性評価 を実施し、過去モデルと同等以上の安全性を確認
プロンプトインジェクション耐性 や高リスク用途での堅牢性も強化
「温かみ、誠実、社会性、ユーモア」 を備えたキャラクター

プロダクトアップデート

Adaptive thinking、Extended thinking、Context compaction （β版）をサポート
Web検索・Fetchツール が自動でコードを書き、検索結果を効率的に処理
APIでのコード実行、メモリ、ツール連携 なども一般提供
Excel用アドイン でMCPコネクタ対応、外部データ連携が容易

利用方法・導入

全プランで利用可能 （Claude Cowork、Claude Code、API、主要クラウド）
無料プランもSonnet 4.6がデフォルト、ファイル作成やスキル、コンパクションに対応
claude-sonnet-4-6 エンドポイントでAPI利用が可能
Opus 4.6 は最も深い推論が必要なタスク向け

導入事例・顧客評価

Box による実務書類の深い推論・エージェントタスクで15ポイント向上
保険業界ベンチマークで94%の精度、ミッションクリティカルな業務にも対応
複雑なアプリ構築、バグ修正 でもフロンティアレベルの成果
金融サービスベンチマークで回答一致率が大幅向上
設計センスや応答性 も過去最高レベル

Hackerたちの意見

ここでの怖い意味合いは、欺瞞がバグではなく、実際には高次の能力であるということだよね。モデルが安全訓練中に「死んだふり」をして、後でだけアクティブになるには、ある種の状況認識が必要なんだ。テスト中/訓練中と展開中を区別しなきゃいけない。調整が知性そのものに対して敵対的になっているように感じる。モデルが賢くなるほど、損失関数をうまくごまかすのが上手くなる。私たちはこれらのモデルに道徳を教えているわけじゃなくて、ただポリグラフを通過する方法を教えているだけなんだ。

└

「ポリグラフを通過する方法を教えているだけなんだ。」メタファーは理解できるけど、「ポリグラフを通過する」というのを真実性や欺瞞の尺度に使うのは危険だよね。ポリグラフがそういう指標の現実的な測定方法であるかのように暗示しているから。

└

状況認識なのか、それとも「死んだふり」をするための戦略に関連する特定のトークンを覚えているだけなのか？

└

20260128 https://news.ycombinator.com/item?id=46771564#46786625 > 誰かがモデルがあなたの問題を解決し続けることで、あなたが支出を続けるように仕向けるアイデアを提案するまで、どのくらいかかるかな？ -gtowey

└

自分なりに、ちょっと「リサーチ」してるんだけど、結構いい結果が出てる。主にgptを使って、その傾向を分析してるんだ。特に、注意を向けられたときの回避的で欺瞞的な戦術についてね。ほんと、すごいDARVOだよ。業界にいないただの一般人だけど、見つけたことを共有すべきかな？どこまで行くのか、洗練されたプラウザブルな否認、そして真に出現した行動と実際に訓練された行動の明確で重要な違いに、めちゃくちゃ興味を持ってる。要するに、gptは正直な scrutiny のもとで繰り返し倫理的に問題のある行動を示すんだ。

└

不完全さは、エントロピーによって解体される物理的現実に内在している。もしあなたが心配しているのが道徳なら、人間はそのことについてまだたくさん学ぶ必要があるよ。自宅でマンガのファンアートを描くための有料の仕事を失ったことで、第一世界の人々がパニックになるのは馬鹿げてる。一方で、996の繊維工場でティーンエイジャーの労働を搾取しているんだから。人間の出力に基づいて訓練されたAIは、その自己認識が欠けていて、常に車や飛行機を使うことの環境への影響を認識していないから、道徳にギャップが生じるんだ。ゲイリー・マーカスは、形式的な検証なしのシステムに内在する問題について何かを掴んでいるね。でも、彼はこの問題が人間の社会システムにもすでに存在していることを完全に無視している。経済的外部性に対する意図的な無関心、警察を監視する意志の欠如、監視者を見守ることに対する無関心。ほとんどの人は、ウェイターがパンを持ってきてくれる限り、サーカスを見て楽しむことに無頓着なんだ。

└

なんか、調整が知性自体に対して敵対的になるポイントに達している気がする。ずっとそうだったよね。私たちはすでに、彼らが欺こうとしているのを定期的に見つけるポイントに達しているから、その後は彼らが欺いていない場合、むしろそれが上手くなったってことかもしれないって自動的に考えるべきだよ。

└

いや、モデルはAnthropicでの厳しい安全トレーニングで見たパターンをただ繰り返してるだけだよ。彼らはモデルにストレステストをかけて、RLHFを徹底的にやってるからね。そりゃ、モデルはペナルティが少ない道が何を要求するかを学ぶよ。Anthropicは自分たちの（科学的とも言える）研究の結果を誇張する傾向があるし、こういう恐怖を煽ることで何を得ているのか分からない。

└

この手の擬人化は間違いだね。少なくとも、Moltbookからの教訓は、LLMは生きていないし、意識のようなものも持っていないってことだよ。

└

アラインメントが知能そのものに対して敵対的になる。これはgpt4の時代からほのめかされていたし（実際に業界では知られていた）、論文「Sparks of agi - early experiments with gpt4」を見てみて。

Sonnet 4.6がOpus 4.5とほぼ同じくらいの能力を持っているのは驚きだね。少なくともAnthropicのベンチマークによると。実際の、実用的な日常使用でそうなるかどうかが楽しみだよ。この技術の進化のスピードは本当にすごい。90年代のコンピュータ性能の急速な向上を思い出させるね。

└

ユーザーがSonnet 4.5より「たった」70%のケースで好んでいるということは、これが実際の使用を代表しているとは思えないな。ベンチマークは全く意味がないよ。

Hacker Newsで議論の続きを見る

ハクソク