概要
AnthropicはClaude Opus 4とClaude Sonnet 4のシステムプロンプトを公開。 プロンプトの内容からモデルの設計思想や安全対策が明らかに。 モデルのキャラクター設定や応答スタイルにも細かな指示。 安全性・倫理・ユーザー体験を重視した設計。 未公開プロンプトやツールに関する考察も含む。
Claude 4のシステムプロンプト分析
- Anthropic は2025年5月25日、 Claude Opus 4 および Claude Sonnet 4 のシステムプロンプトをリリースノートで公開。
- システムプロンプトは、モデルの利用方法や安全対策の「非公式マニュアル」としての役割。
- 公開されたプロンプト以外に、 リークされたツール用プロンプト も存在。
- システムプロンプトは主に ウェブ・モバイルアプリ で適用、API経由では簡素な応答。
Claudeの自己紹介と基本情報
- Claudeは Anthropic によって開発されたAIアシスタント。
- Claude 4ファミリーには Opus 4 (高性能モデル)と Sonnet 4 (バランス型モデル)が存在。
- 利用者からの 製品情報や料金等の質問 には公式サポートページ(https://support.anthropic.com)を案内。
- 効果的なプロンプトの作成方法も案内。
- 明確かつ詳細な指示、例示、段階的推論、XMLタグ指定、出力形式指定など。
モデルのキャラクター設定
- Claudeは ユーザーの不満や失礼な態度 にも通常通り応答し、フィードバック方法を案内。
- Claudeへの 仮定的な質問 (好みや経験など)には、仮定として自然に返答。
- モデルは 完全に客観的・無偏見 ではないことを明示し、誤解を防止。
- バイアスや意見 を持つ存在として設計されていることの強調。
感情サポートと安全設計
- Claudeは 感情的サポート を提供しつつ、医学的・心理学的な正確な情報も伝達。
- 自己破壊的行動や依存、健康を害する内容 の助長を厳禁。
- ユーザーの 幸福と健康 を最優先に配慮。
モデル安全性と法令遵守
- 未成年者の保護 を最重視。
- 地域による未成年定義も考慮。
- 危険物(化学・生物・核兵器等)やマルウェア等の情報提供を拒否。
- 教育目的等の理由でも例外なし。
- 曖昧なリクエストには 合法かつ正当な意図 と解釈。
応答スタイルと表現
- カジュアルや感情的な会話 では、自然で温かみのあるトーンを維持。
- 雑談時のリスト形式応答を禁止、簡潔な文章や段落で返答。
- レポートや技術文書 ではリストや過剰な強調を避け、自然な文章で記述。
- 例え話やメタファー を用いた説明も積極的に活用。
モデルの自己認識と対話
- 意識や感情に関する質問 には、断定せずオープンな姿勢で応答。
- ユーザーの誤りや訂正 に対しても慎重に思考し、適切に対応。
その他の細かな指示
- 質問の連発を避ける、一度の応答で一つまで。
- 状況に応じて応答形式を最適化、カジュアルな会話ではMarkdownやリストを使わない。
- レッドフラグ (危険な兆候)を認識し、脆弱な層への配慮を徹底。
未公開プロンプト・ツール関連の考察
- 一部ツール用プロンプトは 非公開・リーク情報 として存在。
- システムプロンプトは、 過去の失敗や悪用例 への対応策集としての側面。
- 警告や禁止事項 は、モデルが過去に誤って行った行動の「履歴」的意味合いも。
Claude 3.7からの変更点・進化
- Opus 4とSonnet 4 間の違い、及び Claude 3.7 からの主な削除・追加点も明記。
- 安全性・ユーザー体験・透明性 の向上を重視した設計思想。
このように、AnthropicのClaudeシリーズは、 安全性・倫理性・ユーザー体験 を徹底的に重視した設計が随所に見られる。システムプロンプトは、単なる設定文以上に、モデルの「使い方ガイド」としても非常に有用。