概要
- Claude Haiku 4.5 は、最新の小型AIモデルとして全ユーザーに提供開始。
- Claude Sonnet 4 と同等のコーディング性能を、コスト1/3・速度2倍以上で実現。
- リアルタイムAIアシスタント やコーディング用途で、高速かつ高知能な応答を提供。
- 安全性評価 でも高い水準を達成し、AI Safety Level 2(ASL-2)で公開。
- API・各種クラウド で利用可能、詳細はシステムカード・ドキュメント参照。
Claude Haiku 4.5の特徴
- Claude Haiku 4.5 は、全ユーザー向けに即日提供開始。
- 従来の最先端モデル であったClaude Sonnet 4に近いコーディング性能を実現。
- コスト1/3・速度2倍以上 で、効率を大幅に向上。
- 一部タスク(PC操作など)では Sonnet 4を上回る性能 を発揮。
- Chrome拡張 などのアプリケーションで、より高速かつ実用的な体験を提供。
利用シーンとメリット
- リアルタイムAIアシスタント や カスタマーサポート、 ペアプログラミング など、低遅延が重要な用途に最適。
- Claude Code 利用者には、複数エージェントやプロトタイピングで高いレスポンス性を提供。
- Sonnet 4.5 との組み合わせ運用も可能。
- Sonnet 4.5が複雑な問題を分解し、複数のHaiku 4.5が並列でサブタスクを実行。
価格・提供方法
- Claude API で「claude-haiku-4-5」として利用可能。
- 価格は 入力・出力トークン各100万につき$1/$5 の低コスト。
- Amazon Bedrock や Google Cloud Vertex AI でも利用可能。
- Haiku 3.5やSonnet 4の代替 として、より経済的な選択肢を提供。
ベンチマーク・性能評価
- SWE-bench Verified で、Sonnet 4.5の90%のコーディング性能を達成。
- 大規模モデルに匹敵する品質 と評価。
- エージェント型コーディング や 複雑なワークフロー で高い即応性。
- スライドテキスト生成 など指示追従タスクで、従来モデルを大きく上回る精度(65% vs 44%)。
- GitHub Copilot でのコード生成も、Sonnet 4並の品質をより高速に提供。
安全性・アライメント
- 詳細な安全性・アライメント評価 を実施。
- Claude Haiku 3.5より大幅に高いアライメント を達成。
- Sonnet 4.5やOpus 4.1よりも低いミスアライメント率 を記録。
- 化学・生物・放射線・核(CBRN)リスクも限定的。
- AI Safety Level 2(ASL-2) で公開、詳細はシステムカード参照。
技術詳細・評価方法
- SWE-bench Verified :bashとファイル編集ツールを使用、50回の試行平均で73.3%。
- Terminal-Bench :Terminus 2フレームワーク、11回平均で40.21〜41.75%。
- τ2-bench :10回平均、128K思考バジェットで評価。
- AIME・OSWorld・MMMLU など多様なベンチマークで高水準を記録。
- OpenAI・Geminiなど他社モデル との比較も実施。
まとめ・今後の展望
- Claude Haiku 4.5 は、速度・コスト・知能のバランスで新たな標準を提示。
- AIエージェントの新たな可能性 を切り拓くモデル。
- 開発者・ビジネス双方にとって、実用性と経済性を両立 した選択肢。
- 最新情報・詳細評価は公式システムカード・ドキュメント参照。