概要
- Claude Fable 5の 積極的なデバッグ自動化能力 の実例紹介
- スクリーンショットからバグ原因を 自律的に調査・再現
- 複数ブラウザ・依存関係・Web技術 を駆使した問題特定
- 自作コード・自動化フロー の安全性リスクの指摘
- 実際の コスト試算と運用上の注意点
Claude Fable 5による自動デバッグ体験
- Claude Fable 5は 「執拗に能動的」 なAIエージェント
- スクリーンショットと短い指示のみで 依存関係から原因調査 を開始
- Datasette Agent のジャンプメニューに現れた水平スクロールバーのバグ調査
- Claudeは 仮想環境内のsite-packagesやローカルリポジトリ から依存コードを探索
- ユーザーが離席中に 自動でブラウザを操作 し、問題のダイアログ画面を開く挙動を確認
- uv run --with pyobjc-framework-Quartz コマンドでPythonからウィンドウ情報を取得
- Safariウィンドウを特定し、 screencapture CLI で自動スクリーンショット取得
- 再現用HTMLページ を自作し、Safariで開いて挙動を観察・記録
- テンプレートを編集し、 JavaScriptでキーボードショートカット(/キー)を自動発火
- ページロード1.2秒後に モーダルダイアログを自動で開く スクリプトを挿入
独自Webサーバとデータ収集
- Claudeは http.server を使い、 CORS対応のローカルWebサーバ を自作
- Webページから JavaScriptで<textarea>要素のCSS情報・サイズをPOST し、/tmp/diag.jsonに保存
- shadow DOM 内の要素にも自動でアクセスし、詳細な情報を収集
- 取得データを基に 原因分析・修正案検証 を実施
問題特定から修正までの自動フロー
- ローカル開発サーバの起動方法や環境変数も 自動で推測・設定
- Playwrightで Chrome/Firefox/WebKit を自動起動し再現性検証
- Chromeのスクロールバー表示設定 を一時的に変更
- FirefoxのウィンドウID取得にosascriptが使えない場合も Python+pyobjcで回避策
- テンプレート改変による 修正案の即時テスト
- 修正が有効か Safariで最終確認
- セッション中の全自動化手法とコード例を /tmp/automation-report.md に自動レポート
コスト試算とセキュリティ懸念
- Claude Maxプラン($100/月)利用、 Fable利用分は6月22日以降API従量課金
- 今回のセッション想定コスト: 約$12.11
- AgentsView を用いた利用状況の可視化
- Fableの 高い自律性と非公開技術 によるセキュリティリスク
- ターミナルで実行できる全ての操作がAIにも可能
- プロンプトインジェクション 等による悪用リスク
- サンドボックス外での運用は 重大事故の温床
- Johann Rehberger によるAIリスク論「Normalization of Deviance in AI」への言及
- Fableの賢さは 両刃の剣 であり、悪用時の被害規模も甚大
まとめ
- Claude Fable 5は 人間以上の自律的なバグ調査・修正能力 を持つ
- Web自動化・依存関係解析・独自サーバ構築 など多彩な手法を即興で組み合わせる柔軟性
- その一方で、 運用時のセキュリティ対策・権限管理 が不可欠
- デバッグや自動化の未来像 を提示しつつも、 リスク認識と慎重な運用 が求められる