概要
- Claude Fable 5 は、一般利用向けに安全設計された 最先端AIモデル の新しいリリース。
- ソフトウェア開発、知識作業、視覚処理、科学研究 など、多岐にわたる分野で他モデルを凌駕。
- 強力なサイバーセキュリティ機能 を持つが、誤用防止のため厳格なセーフガードを実装。
- Fable 5 と Mythos 5 は、価格も大幅に引き下げられ、より多くのユーザーが利用可能。
- 今後さらに安全性と精度を高め、利用範囲を拡大予定。
Claude Fable 5:一般向け最先端AIモデルの概要
- Claude Fable 5 は、Anthropicが開発した Mythos-class1モデル の一般公開バージョン。
- これまで公開されたClaudeシリーズの中で 最高性能 を発揮。
- ソフトウェアエンジニアリング・知識作業・ビジョン・科学研究 など、幅広い分野で高いベンチマークスコアを記録。
- 長時間・複雑なタスク ほど、他モデルとの差が顕著。
- サイバーセキュリティ など悪用リスクの高い領域には厳しいセーフガードを設置。
- 一部トピックでは、 Claude Opus 4.8 へ自動的に切り替え対応。
- セーフガードは保守的に設定されており、平均で5%未満のセッションで発動。
- 今後、さらなる高性能モデルの登場とともに、セーフガードの改善と誤検出の削減を推進。
Claude Mythos 5:限定公開モデル
- Claude Mythos 5 は、Fable 5と同一の基盤モデルを持つが、一部セーフガードを解除。
- 主に サイバーセキュリティ関係者・インフラ提供者 向けに限定公開。
- Project Glasswing を通じて米国政府と協力し、Claude Mythos Previewのアップグレードとして提供。
- 世界最高水準の サイバーセキュリティ能力 を誇る。
- 今後、信頼できるアクセスプログラムを拡大予定。
Fable 5 & Mythos 5の社会的インパクト
- Project Glasswing で重要ソフトウェアの防御支援など、社会的貢献の実績。
- ライフサイエンス研究 分野でも新しい仮説提案や新薬開発の加速を実現。
- 価格は 入力トークン100万あたり$10、出力トークン100万あたり$50 と、従来モデルの半額以下。
- より多くのユーザーに 高度AI機能 を安全かつ迅速に提供することを目指す。
Fable 5と他モデルの比較・特徴
- 自律的作業能力 が大幅向上し、過去のClaudeモデルより長時間のタスク処理が可能。
- ソフトウェア開発 :Stripeのテストでは、数か月分のエンジニア作業を数日で完了。
- 5000万行のRubyコードベースを1日でマイグレーション。
- CognitionのFrontierCode評価 で最高スコアを記録。
- 知識作業 :HebbiaのFinance Benchmarkで最高スコアを獲得。
- ドキュメント推論、チャート・表の解釈、問題解決で顕著な成果。
- IMCのトレーディング分析 でも高評価。
- ビジョン分野 :科学図表から正確な数値抽出、スクリーンショットだけでWebアプリの再構築。
- ポケモンFireRed をビジョンのみでクリア。
- メモリ・長文処理 :数百万トークンの長期タスクで高い集中力を維持。
- Slay the Spire でファイルベースメモリ活用時のパフォーマンスがOpus 4.8の3倍向上。
- 創薬・分子生物学 :Mythos 5によるプロテイン設計で人間専門家と同等以上の成果。
- 14ターゲット中9つで有望な薬剤候補を創出。
- 独自の分子生物学仮説を安定して生成し、80%の確率でOpusクラスより優先選択。
- ゲノミクス研究 :1週間以上の自律作業でScience誌に掲載されたモデルを凌駕する結果。
- アラインメント(整合性) :自動評価でOpus 4.8と同等の低い誤動作率。
早期利用者からのフィードバック
- CursorBench で最先端の結果を記録、従来モデルでは不可能だった長期課題を解決。
- GitHub :複雑な長期コーディングタスクで高い自律性と信頼性を実現。
- エージェント型開発・プロトタイピング で顕著な進歩。
- シニア研究者レベル の推論能力、資源配分、誤信念の修正、独自の成果物生成。
- ユーザーの意図理解 が大幅向上、従来100回必要だったプロンプトが一発で完結。
- 法務分野 でも現行モデルを上回る精度を実証。
- 自律的な自己検証・自己反省 が可能となり、複雑なマルチエージェントワークフローを効率化。
- 金融・分析分野 で最高水準の成績、Opusより10ポイント高いスコアを達成。
- 物理研究・アプリ開発・スプレッドシート処理 でも全体的な作業効率と精度が向上。
Fable 5の新セーフガードと安全対策
- Mythos-classモデル は悪用リスクが高いため、厳格なセーフガードを実装。
- Project Glasswing で限定公開し、十分なセーフガードが整うまで一般公開を見送り。
- 現在は安全性を最重視し、誤検出の発生も許容した設定。
- 今後、ユーザー体験を損なわず、 誤検出の削減 と 安全性の両立 を目指して改良を継続。
- セーフティ・クラシファイア :サイバーセキュリティや生物学研究など、デュアルユースリスクの高い分野で悪用防止。
- 悪意あるユーザーによる回避策にも耐える設計。
- 詳細は システムカード および最新リスクレポートで評価。
このように、 Claude Fable 5 および Mythos 5 は、AIの新たな可能性を切り拓くと同時に、安全性と社会的責任にも最大限配慮した設計がなされている。