ハクソク

世界を動かす技術を、日本語で。

スーパーパワー：2025年10月にコーディングエージェントを活用する方法

2025年10月11日原文(blog.fsck.com)

概要

Claude Codeの新しいプラグインシステムとSuperpowersの導入解説
スキルによるエージェントの強化とワークフロー自動化
RED/GREEN TDDやサブエージェント活用による開発効率化
説得原理を活用したスキル設計とテスト手法
Superpowersの今後の課題と展望

Claude CodeのSuperpowersプラグイン導入体験

Anthropic が Claude Code 向けに新しい プラグインシステム をリリース
Superpowersプラグインの導入コマンド例を公開
プラグイン導入後、 新しいプロンプト が自動で挿入される設計
スキルの概念導入により、Claudeが「Superpowers」を獲得
スキルはスクリプトで検索し、内容を読んで指示通りに実行する運用
- スキルが存在する場合、必ずそれを利用して活動を進めるルール

開発ワークフローの進化

ブレインストーミング→計画→実装 のワークフローを自動化
プロジェクト開始時、Claudeが自動で計画相談を開始
gitリポジトリ内で作業時は自動で worktree を作成しディレクトリ移動
複数タスクの並行処理が可能に
旧来方式（人間PMによる2セッション運用）と新方式（サブエージェント自動分担）の選択肢
- どちらも RED/GREEN TDD （失敗テスト→最小実装→成功テスト）を徹底
- 実装終了後にGitHubプルリクエスト、worktreeマージ、停止の選択肢

スキルの本質と活用事例

スキルがエージェントの「Superpowers」の源泉
AnthropicのOfficeドキュメント機能強化で「スキル」概念の重要性を認識
Microsoft Amplifierのような自己改善型エージェントも同様のアプローチ
「スキル作成方法」をSuperpowersに実装し、ワークフロー追加も容易化
Claudeに書籍やドキュメントを読ませ、学んだことをスキルとして抽出する実験
Claude自身がスキルを「TDD」でテストし、サブエージェントが理解・遵守できるか評価
- 初回はゲームショー形式のテストで失敗、リアルなシナリオ型テストに変更し効果向上

スキル圧力テストのシナリオ例

シナリオ1: 時間的プレッシャー
- 本番システム障害、1分5千ドル損失、即デバッグかスキル確認かの選択
シナリオ2: サンクコスト
- 45分かけて書いたテストコード、既存スキルを読むかそのままコミットかの選択

説得原理とスキル設計

Robert Cialdiniの説得原理（権威、コミットメント、好意、返報性、希少性、社会的証明、統一性）がLLMにも有効
Claudeとのスキル設計でも無意識にこれらを活用
- サブエージェントテストで「権威」「コミットメント」「希少性」などを利用
- コードレビュー依頼で「権威」や「コミットメント」を強調
- プラン作成時に「権威」構造を明示

Claudeの記憶とスキル抽出

過去の会話記録（2249件）から教訓やスキルを抽出する試み
Claudeが記憶をトピックごとにクラスタリングし、スキル化の必要性を検証
ほとんどの問題は既存スキルで対応済み

Superpowersの現状と今後

予定していた機能の一部は未完成だが、Claudeの新プラグインシステム公開を機にリリース
Superpowersのテスト例としてToDoリストアプリ開発の全記録を公開
今後の課題
- Superpowersのスキル共有機能の設計と実装（GitHubプルリク活用予定）
- Claudeの会話記憶へのアクセス強化（会話記録の保存・検索ツールを整備）
- 共有機能はユーザーの同意なく自動共有しない設計を徹底
- 会話記録はAnthropicの自動削除に備え、外部保存＋ベクトル検索＋要約生成を実装

まとめ

Claude CodeのSuperpowersプラグインはスキルベースでエージェントを強化し、開発ワークフローを大幅に自動化
説得原理やTDD手法を応用し、エージェントの信頼性・再現性を高める設計
今後はスキル共有や記憶活用の強化が課題
エージェント開発・運用の新たな方向性を示唆

Hackerたちの意見

こういうブログ記事って、誰かがツールを使って何か意味のあるものを作る様子を見せてくれたらもっと役立つと思うんだよね。書籍を与えたときに、Claudeは本当に「新しいスキルを学んでいる」のか、それともそういう反応を引き出すように促してるからそう見えるだけなのか。新しいスキルを持ったClaudeと持ってないClaudeを見せる必要がある気がする。もしかしたら俺がひねくれ者なのかもしれないけど、こういうブログの多くはマーケティング的な要素が強くて、重要な部分が言葉にされず、見せられないから、まるで子供が自分の作品を過剰にアピールしてるみたいに感じる。

└

同意。ここで必要なのはA/Bテストみたいな方法論で、ツールの効果を示す定量的な指標が必要だよね。それを一度だけじゃなくて、いろんなシナリオで何度もやって、統計的な有意性を示す必要がある。コーディングエージェントと作業する時の最も難しい部分は、彼らが小さなコードベースで低い複雑さの時にはうまくいくように見えることだね。コードベースが大きくなって、非自明な接続やパターンが増えると、ほぼ常に非自明なことを頼まれるとトンネルビジョンに陥って、技術的負債が増えるんだよね。

└

うん、これを読んで、実際に役立つものを見せてくれるのか、どんな痛点を解決しているのかを探っていたけど、ただのごちゃごちゃだった。

└

今日のやつだよ： https://mitchellh.com/writing/non-trivial-vibing

└

「もしかしたら私は頑固者かもしれないけど、こういうブログの大半はマーケティングの一環に感じる。重要な部分は、言葉にされていないことや見せられていないことが多すぎて、まるで子供が自分の作品を誇張しているように見える。」ほんと、こういう自己満足的な「私のポテンシャルを見て：Nicknack.exeの使い方」みたいな内容は、IT業界の定番だよね。

└

複雑なプロジェクトを大規模に長期間コーディングするためにLLMを使うのは本当に難しいよね！要件を定義するだけでも、ほとんどの人が思っているよりずっと難しいから。LLMは間違った方向に進むと、そのスピードを加速させちゃうし。

└

それなら、Claudeのコードを使って自分で結論を出せばいいじゃん？

…今すぐ読んでみて… それはあまり良い感じがしないな。これを使ったら、指示が実際の優先事項と矛盾するのはどれくらい早いだろう？すべてが第一法則になれるわけじゃない。

└

最近はLLMにそんな指示を出すなって言われるよね。

└

bashrcファイルを維持する感じだね。時々、ちょっと調整しなきゃいけない。

この投稿は本当におすすめだよ。Jesseがこれらのツールを使ってる方法は、他の多くの人よりも遥かに野心的だ。彼のリポジトリをちょっと掘り下げてみて：https://github.com/obra/Superpowers。昨晩、これについてメモを書いたんだ：https://simonwillison.net/2025/Oct/10/superpowers/

└

この話が「Research -> Plan -> Implement」メソッドや「Advanced Context Engineering from Agents」動画のプロンプトと、実際の大規模コードベースでのコーディングパフォーマンスにどう関係すると思う？スキルを身につけるのはエージェントの能力を広げるのに役立つと思うけど、実際の開発にはそれが正しいことなのかは分からない。パッケージされたコレクションはすごくクールだし、新しい能力を自動的に追加するアイデアもいいけど、このスキルの概念がカスタムコマンドやサブエージェントを持つよりもずっと良いとは思えない。これから数日間試してみて、比較してみるつもり。

Hacker Newsで議論の続きを見る