Launch HN: Morph (YC S23) – AIによるコード編集を4,500トークン/秒で適用

2025年7月7日

概要

MorphはAI生成コードの編集を高速かつ信頼性高く既存ファイルへ適用するモデルを開発。従来のフルファイル書き換えや検索置換に比べ、圧倒的なスピードと正確性を実現。独自のFast Applyモデルと推測デコーディング技術を採用。無料で利用できるライブデモやAPIも提供。今後はインライン編集や次回編集予測機能も展開予定。

Morphの高速AIコード編集モデルとは

Morph はAI生成コードの編集内容を 既存ファイルへ直接・高速適用 するモデルを開発
4,500トークン/秒 超の適用速度を実現するFast Applyモデルを提供
従来の フルファイル書き換え や 検索置換 の課題（遅い・高コスト・エラー多発）を解決
編集は「// ...existing code...」のような 既存行参照形式 で出力
Fast Applyモデル＋推測デコーディング でAIパッチを即時・高信頼で適用
Cursorが先駆的に採用した手法だが、 API提供がなかったためMorphが独自開発
大規模無料枠 あり、誰でも利用可能

利用方法・デモ・ドキュメント

ライブデモ （サインアップ不要）: https://morphllm.com/dashboard
クイックスタートガイド: https://docs.morphllm.com/quickstart
YouTubeデモ動画: https://www.youtube.com/watch?v=LdT8epGHJPk

提供モデルと導入事例

morph-v3-fast: 4,500トークン/秒超の超高速モデル
morph-v3-large: 2,500トークン/秒の大規模モデル
Fast Apply技術 はcreate.xyz、databutton、continue.devなどで採用実績
埋め込み・再ランキング用リトリーバルモデル も提供

今後のロードマップ

Inline Edit Model (Cmd-K): 開発者の作業状態を維持しつつ、超高速インライン編集を実現予定
Morph Tab API: 次回のコード編集やアクションを 500ms未満で予測 するモデル（プライベートベータ中・早期アクセス申請可）
申請フォーム: https://morphllm.com/tab

Morphによる業界への提言

推論速度の向上 はUXにおいて精度向上より重要という見解
フルファイル書き換え は旧世代、 Fast Apply編集 が速度・コスト・信頼性で優位
ベンチマークが飽和する中、 タスク特化型・推論最適化モデル の重要性が増加
Frontierモデルは複雑なタスクへ、単純タスクは特化型モデルが担う時代への移行

コーディングエージェントへのフィードバック募集

開発者体験や意見、アイディアの共有を歓迎
コーディングエージェント活用事例や要望の募集

Hackerたちの意見

生の推論速度は、開発者のUXにとって、段階的な精度向上よりも重要だと思う？賛成？反対？ちょっと話題を作ろうとしてるのは分かるけど、正直言ってこれは間違ってると思う。人は、コーディングの質を重視するから、もっと大きな（または推論する）モデルを使いたがるんだよね。5kトークンの大きな編集をする場合でも、編集時間の200-300msの違いなんて大したことじゃない。編集速度は確実に開発者のUXのボトルネックじゃなくて、質が重要なんだ。200msのために質を犠牲にする開発者には、ちょっと共感できないな。1-2人のエージェントを並行して使ってると、ほとんどの場合、他のエージェントのコードをレビューしてる間に編集はもう適用されてるし。でも、これが俺だけかもしれないけど。質について言えば、どうやって測ってるの？ベンチマークはあるの？速いモデルと大きなモデルのエラー率の違いはどれくらい？

└

マーケティングの言葉からは、質に自信がなくて量をアピールしたいみたいに感じるね。でも、俺も同じ立場だから、4500トークン/秒の使い捨ての回答を1時間かけてキュレーションするより、正しい答えを10トークン/秒で得られる方が嬉しいよ。ベンチマークのパフォーマンスは、遅延よりも100倍重要だと思う。もしこれらの「ホットテイク」がMorphの開発哲学にまで及ぶなら、ユーザーじゃなくてよかったと思う。

└

それは状況によると思う。開発者がフロー状態を保つために測るべき実際の要素があるからね。多くのエラーや遅延がこれを壊す。簡潔に言うと、はい、精度が最優先だよ。質は主に2つの方法で測定される：1) エンドツーエンド：ユーザーのクエリからタスクの解決まで。これは実際のタスク完了の質問に答えるスタイルのベンチマーク。2) 質の適用：構文の正確さ、文字の差異など。大きなモデルと速いモデルのエラー率は約2%だよ。もし非常に複雑なコード編集やマイナーな言語を扱っているなら、大きなモデルがより良い選択だね。タスクに最適なモデルにルーティングする自動オプションもあるよ。

└

推論が約50%速くなることは、単一桁の精度向上よりも、俺のワークフローにとってずっと価値があると感じてる。どうせ変更が正しいか確認しなきゃならないなら、より早く多くの反復を行える方が、段階的な精度向上よりもずっと良い気がする。ただし、明確な転換点はあるよ。精度の向上が高すぎて、作業をあまり注意深くチェックしなくても良くなるなら、推論速度の利点はほぼゼロになるね。

└

スローはスムーズで、スムーズは速い。

└

私の理解では、これは±300msじゃなくて、300ms対10秒みたいな感じだよ。それって大きな違いだよね。個人的には、こういう大きなモデルを待つ時間が制約になってると思う。これって、比較的簡単なタスクに対してリソースの無駄遣いかもしれないし。（LLMの一般的な機能近似と比べて）でも、正直言って、賢く編集を適用するタスクは伝統的なコーディングタスクの範疇に入ると思うんだけど、何がそんなに難しいの？賢いdiffアルゴリズムでできないの？

└

速いモデルを使った後に遅いモデルを使うのは耐えられないって認めざるを得ない。質と速度が線形に関係しているかはわからないけど。

└

コーディングにはOpusを使わないで、Sonnetの方が好きだな。多くのタスクは反復や監視があった方がうまくいくし、Sonnetがそれを可能にしてくれる。

└

レビュー時間がボトルネックになってるみたいだね。今、コーディングエージェントの出力をレビューするのをもっと速くするためのものに取り組んでるんだ。もし時間があれば、あなたのワークフローについてインタビューしたいな。ここに返信するか、プロフィールにある連絡先を見つけてね。-- ジミー・コッペル博士

└

完全に同意するよ。AIモデルから提案された変更セットを受け取ったら、まずは慎重にレビューするのが最初のステップだよね。大抵の場合、特定のトークンや文脈をスキップしちゃうから、コードが重複することが多いんだ。それをユーザーがプロンプトに含めなかった場合もあるし。変更を一括適用するのは、デバッグがさらに難しくなるコードを作るだけだし、そんな大量のコードインジェクションは、思ってるより早くコードを壊しちゃうよ。B、サム

最後にMorphを見たとき、OpenRouterにはまだ載ってなかったよね。今は変わったみたいだけど、古いモデルしか載ってないみたい。もっとアクティブになる予定はあるの？それと、あなたの速い適用モデルとRelaceやCerebras経由のLlamaなど他のモデルとの比較ベンチマークはある？特に出力の精度に興味があるんだ。

└

現在リストされているv2モデルはmorph-v3-largeを指してるよ。v3-largeとv3-fastをリストするために彼らと協力してるところだ。

Hacker Newsで議論の続きを見る

ハクソク