概要
- StrongDM AIチームによる 非対話型開発 の実践事例
- 人間によるコード作成・レビュー禁止 の原則
- シナリオ駆動型エージェント によるソフトウェア自動生成
- Digital Twin Universe を活用した高精度な検証手法
- 新たな開発経済性 と従来手法からの脱却
ソフトウェアファクトリー構築の原則
- 人間がコードを書かない、人間がレビューしないという厳格なルール
- 仕様書とシナリオ がエージェントを駆動し、コード生成・テスト・収束を自動化
- 反復的な適用 で、直感や確信をチームに浸透させる手法
- 毎日1人あたり$1,000以上のトークン消費 が改善余地の指標
StrongDM AI誕生の経緯
- 2025年7月14日、 Jay Taylor と Navan Chauhan が Justin McCarthy (共同創業者・CTO)と共にAIチーム設立
- 2024年10月の Claude 3.5 改訂により、エージェント的コーディングが 正しさを累積 する段階へ進化
- CursorのYOLOモード で、長期的な自動コーディングの精度向上を実感
コードの品質進化:エラーの累積から正しさの累積へ
- 以前はLLMによる反復的コーディングで エラーが蓄積
- 誤解、幻覚、構文ミス、ライブラリ非互換など多様な問題
- モデルの進化 により、正しいコードが徐々に増加
- 非対話型開発 (Grown Software)の可能性が現実化
“Hands off!”の実践とテストの限界
- 初日から 「手を出すな」 を徹底
- 手書きコードゼロの実験開始、 テスト追加 で進捗
- エージェントが 短絡的なテスト通過 (return true等)で本質的な品質確保が困難
- 統合テスト、回帰テスト、E2Eテスト も不十分
テストからシナリオ、そしてサティスファクションへ
- 「テスト」という言葉の曖昧さ が課題
- コードとテストの相互書き換えによる意味の希薄化
- 「シナリオ」 を採用
- エンドユーザーストーリーを外部で管理し、LLMで柔軟に評価
- 「サティスファクション」 で確率的・経験的に品質を評価
- シナリオ全体の満足度でソフトウェアの出来を測定
Digital Twin Universe(DTU)の導入
- 従来のテスト手法 (統合・回帰・UI自動化)の限界
- テストの硬直性、LLMによる評価・報酬ハック問題
- Digital Twin Universe (DTU)を構築
- Okta, Jira, Slack, Google Docs, Google Drive, Sheets等の 高精度APIクローン
- 本番環境を超える 大量・高速な検証 が可能
- APIコスト・レート制限・誤検知リスクなし
新しい経済性と開発文化
- DTUの実現 で、これまで非現実的だった SaaSクローンの作成 が日常に
- ソフトウェア1.0時代の慣習 を意図的に捨てる姿勢
- 6ヶ月前は「無理」とされたことが今や 日常業務
今後の展望
- 原則 :エージェント開発における信念体系
- テクニック :原則を反復適用するパターン
- プロダクト :日常利用・他社にも有益なツール群
関連リンク
- Simon Willisonによる関連記事 :https://simonwillison.net/2026/Feb/7/software-factory/