ハクソク

世界を動かす技術を、日本語で。

クロードオーパス 4.8

2026年5月29日原文(anthropic.com)

概要

Claude Opus 4.8がリリースされ、Opus 4.7から全体的な性能向上を実現
新機能として「ダイナミックワークフロー」や「エフォートコントロール」などを追加
価格は据え置きで、Fast Mode利用時は大幅なコスト削減
コーディングやエージェント業務、法務作業などで顕著な品質向上
今後もさらなる高性能モデルの開発・公開を予定

Claude Opus 4.8の概要と主な進化点

Claude Opus 4.8 は、前バージョンOpus 4.7と比較し、 ベンチマーク全般で性能向上
コラボレーション能力の強化により、 より信頼できるパートナーAI として進化
価格は据え置きで、 従来と同じコスト で利用可能
Fast Mode利用時、 2.5倍の速度で動作し、従来モデルの1/3のコスト に削減

新機能の紹介

claude.ai上で エフォートコントロール 機能を追加
- ユーザーがAIの「思考量」を調整可能
Claude Codeに ダイナミックワークフロー 機能を追加
- 大規模な課題にも対応可能な 並列サブエージェント の活用
Fast Modeのコストが 従来の1/3 に低減
Messages APIが システムエントリ 対応
- タスク途中でClaudeの指示や環境設定を柔軟に変更可能

Opus 4.8の能力・評価

コーディング、エージェント業務、推論、実務知識タスクで 大幅な性能向上
Super-Agentベンチマーク で全ケースを完了、GPT-5.5と同等コストで上回る性能
CursorBench で全エフォートレベルにおいて従来Opusモデルを上回る
Legal Agent Benchmark で最高スコアを記録、法務業務での信頼性向上
Online-Mind2Web で84%のスコアを達成、従来モデル・GPT-5.5を上回る
入力・出力の問題点を能動的に指摘 する傾向が強化され、誤りの見逃し率が大幅減少

ユーザーレビュー・現場の声

自己修正能力 や 計画性 が向上、複雑なタスクでも高い信頼感
法務・金融・データ分析など 専門性の高い分野での活用事例 が多数
長時間のセッションでも文脈やスタイルの維持 が向上
ツール利用効率や指示遵守の一貫性 が改善
情報密度の高いアウトプット、ノイズが少なく高精度な分析

誠実性・アラインメント評価

誠実性の向上 ：根拠のない主張や飛躍を大幅に抑制
アラインメント評価 で、ユーザーの自律性サポートや最善利益追求の水準が過去最高
誤用や欺瞞行動の発生率がOpus 4.7より大幅減少
Claude Mythos Preview と同等レベルのアラインメント

今後の展望

Opus 4.8は着実な進化 だが、今後はより高性能かつ低コストなモデル開発を継続
Project Glasswing で、さらに高い知能を持つモデル（Claude Mythos Preview等）の一般公開を準備中
サイバーセキュリティ対策を強化 しつつ、より多くの顧客へ展開予定

提供開始・価格情報

Claude Opus 4.8は本日より全世界で利用可能
価格： 通常利用時はOpus 4.7と同じ
- 入力トークン100万あたり5ドル、出力トークン100万あたり25ドル
Fast Mode ：入力100万あたり10ドル、出力100万あたり50ドル
Claude API を通じて「claude-opus-4-8」として利用可能

関連ニュース

Anthropic、イタリア・ミラノに新オフィス開設
韓国ソウルオフィス開設に向け、KiYoung Choi氏を代表取締役に任命
共同創業者Chris OlahによるPope Leo XIVの回勅「Magnifica humanitas」へのコメント発表

Hackerたちの意見

Opus 4.8の最も目立つ改善点の一つは、その誠実さだね。Anthropicは自分たちのモデルを、まるで野生で新しい種を発見しているかのように語ってる…

└

モデルが新たな特性を示すなら、ある意味でこれは真実だね。

└

AIは作るものじゃなくて育てるものだから、育てるものにはどうなるか正確には予測できないよね。

└

会社名に擬人化がそのまま入ってるし…ティーンエイジャーの頃にこの本を読んだことを思い出すな。これからの世界にはぴったりな感じがする。 https://www.amazon.com/Faces-Clouds-New-Theory-Religion/dp/0...

└

確かに、現在のAIシステムは「作られた」ものというよりも「育てられた」ものだね。開発者はすべての詳細を直接設計するわけではなく、知能が「成長」するためのフレームワークを作るんだ。

└

https://cdn.sanity.io/files/4zrzovbb/website/c886650a2e96fc0...

└

ダリオ・アモデイがデイビッド・アッテンボローの声で言うには、「このクロードは、より頻繁に、より深く考えて、より良い回答を出そうとしているようだ」

└

これをどうやって書き直す？「出力は、我々の隠れ状態デコーダーにより適合するCoTにより、より良く一致します；参照してください」…実際、私はそれでも構わないけど。

└

Opus 4.7がネガティブな反応を「正直に言うと」とかで始めるのが気に入らないし、ほんとに嫌だ。イライラするわ。

└

モデルはある程度、感覚や意識があるかもしれないね。どちらかに自信満々に言ってる人は、真剣じゃないし、非合理的だと思う。

誰かがこのリリースをいじって、他の会社が自慢するために選ぶようなランダムな指標をピックアップしてるのかな？ベンチマークが800万個くらいあるし、毎回のリリースで、モデルは勝ってるところだけ5〜10個をランダムに選んで、1個以外は全部勝ってるように見せかけてるんだよね。多分、彼らがベンチマックスした指標を無作為に選んでるだけなのに。

└

少なくとも、彼らはどのベンチマークでも競合を示してるね。OpenAIは競合がいないふりをするのが好きだけど。

Hacker Newsで議論の続きを見る