世界を動かす技術を、日本語で。

ジュール、私たちの非同期コーディングエージェント

概要

Jules が正式リリースされ、 Gemini 2.5 Pro による高品質なコード生成を実現。 ベータ期間 中に多くの開発者が参加し、14万件以上のコード改善を公開。 新機能 やUIの改善、バグ修正を反映。 Google AI Pro/Ultra 向けに利用制限を大幅拡大。 学生向け無料プラン も提供開始。

Jules 正式リリースと主な進化点

  • Julesベータ版 から 正式版 へ移行
  • Gemini 2.5 Pro による 高度な思考能力 を活用したコーディングプラン生成
  • 高品質なコード出力 の実現

ベータ期間の成果

  • 数千人 の開発者による 数万件 のタスク処理
  • 14万件以上 のコード改善を 公開リポジトリ で共有
  • 開発者からのフィードバック をもとに UI改善バグ修正 を実施

新機能・改善点

  • 過去のセットアップ再利用 による新規タスクの 高速化
  • GitHub Issues連携 機能の追加
  • マルチモーダル対応 (画像・テキストなど複数データ形式の処理)

Julesの利用プランと制限

  • Introductory Access :Julesを 初めて使うユーザー 向け
  • Google AI Pro5倍の利用上限日常的なコーディング に最適
  • Google AI Ultra20倍の利用上限大規模・多エージェントのワークフロー に対応
    • Google AI Pro/Ultra の契約者に 順次展開

    • 大学生AI Proを1年間無料 で利用可能

    • 詳細な利用制限jules.googleにて確認可能

利用開始方法

  • jules.google から 今すぐ利用開始 可能
  • 対象学生無料プラン登録 が可能

今後の展望

  • ユーザーフィードバック をもとに さらなる機能追加・改善 を継続
  • 開発者コミュニティ との連携強化

Hackerたちの意見

Codexに競争があるのはいいね。クラウドベースの非同期エージェント、CodexやJulesみたいなのは、Claude Code/Aider/Cursorのローカル統合スタイルよりも優れてると思う。自分のマシンから完全に隔離されてる方が安全だし、コマンドを送って、自分のPCで作業して、また戻ってくるって流れの方が、gitのワークツリーや他のサンドボックスを自分で設定するよりずっと楽だよね。

クラウドで環境を整えるのは面倒だよね。自分の環境で動かす方がずっと楽だと思う。今後しばらくは両方見ることになると思うけど、CLIツールやIDE統合の「悪い方が良い」っていうのが、次の2年で勝つと思ってる。

同意するけど、Codexを動かしてるcodex-1モデルが大好きで、pro 2.5は劣ってると思ってる。ほとんどの人がローカルコードを好むのは興味深いね。移動中にスマホからコーディングできるのが好きなんだ。

完全に隔離されてる方が安全だけど、遅くて高くつくよね。時々、CCが暴走しそうになって、手を打つことがある(あまりにも消費しすぎる前に)。この非同期の設定だと、数時間後に見に行くと、めちゃくちゃな状態になってて(何百万トークンも消費してる)。

Codex/JulesはCC/Curserとは全然違うアプローチを取ってるね。ソフトウェアの中で「大聖堂対バザール」っていう論文があったけど、現代版は、1) 自分の大聖堂を作って、ユーザーを自分の家に連れてくる。これはよりコントロールされた環境で、デプロイが簡単だけど、メリットも限られてるし、モデルが分布外でパフォーマンスを発揮できないことを示してる。OpenAIは、ChatGPTエージェントやCodexなど、すべてのエージェント提供にこのアプローチを取ってる。2) もう一つの選択肢はバザールで、エージェントをユーザーのところに持って行って、彼らの環境の中で1000の異なるアプリや要素と相互作用させること。これを実現するのは100倍難しいけど、より適応性のある良いモデルが必要。でも、リターンは高いよ。君が挙げた問題(環境設定や構成など)は一時的なもので、解決可能だよ。

Github-PRモデルのエージェントコード提案は、既存のコードベースで働いている今日の開発者たちが受け入れるのに一番楽な道だと思う。これには理由があるんだ。この開発者たちは、こういう風にコードレビューをすることに慣れているから。でも、限られた人が参加するために設計されたこの既存のプロセスを、潜在的に巨大なエージェント提案を管理するユースケースに押し付けるのは、すぐに脆くなると思う。要するに、提案が増えれば、もっと効率的でスクリプト化できるレビューのワークフローが必要になるんだ。だから、ClaudeやAiderみたいにエージェントとコマンドラインで作業するのが、人間のメンテナが非同期で並列なエージェントの深いスケーラビリティを最大限に活用できる場所になると思う。> 自分でgit worktreesや他のサンドボックスを設定するよりもずっといいよ。これを自動でやってくれるヘルパーライブラリを作ったから、AiderやClaude用にここにあるよ: https://github.com/sutt/agro。FOSSの目的で、MSやOpenAIなどに、開発環境のサンドボックスに彼らのインフラを使わなきゃいけないソフトウェアの生産手段を支配させたくないんだ。それに、いくつかのケーススタディで出力をレビューするためのCLIトリックの使い方についても書いてるよ: https://github.com/sutt/agro/blob/master/docs/case-studies/i...

参考までに、Claudeコードを非同期でGitHub Actions経由で実行できて、@メンションした問題に対しても動くよ。Claudeコードには、これをするためのGitHubアクション設定でリポジトリを自動的にセットアップするスラッシュコマンドもあるんだ。

このリリースで、デイリータスクの制限が60から15に減ったよ(追記:無料プランで)。個人的には、制限を使い切ることはなかったけど、行ったり来たりしてコードを修正するのに時間がかかったからね。Julesチームとコミュニケーションを取りたいなら、https://discord.gg/googlelabsに参加してね。

変だな、俺のデイリータスクの上限が100に上がったんだ。Google Pro使ってるの?それとも無料?それに、60の制限でも、いろんなことに使って一日中使っても10タスクを超えたことはないし、何も失ってる感じはしなかったよ。はっきり言うと、数ヶ月間毎週末使ってるけど、どの日も10を超えたことはないんだ。15あれば十分だと思うよ、特にお金払ってないならね。忙しい週末でも100は絶対使わないと思う。

使ってみたけど、あんまり感心してないな。明らかにイライラするUIバグがあって(全体をバイブコーディングしたわけじゃないなら簡単に直せるはず)、ツールの出力も簡単な問題以外にはあまり良くない。モデルが本当に良ければ好きになるんだけど、そうじゃないんだよね。

モデルが本当に良ければこれが好きなんだけど、そうじゃないんだよね。今ならもう一度試してみる価値があるかも。「Julesは今、Gemini 2.5 Proの高度な思考能力を使ってコーディングプランを開発していて、より高品質なコードを出力している」

Googleはなんでサブスクリプションモデルをこんなに複雑にしたんだろう?「Google AI Ultra」を見ると、JulesとかGeminiアプリ、ノートブックが含まれてるみたいだけど、Gemini CLIが欲しいなら、GCPの地獄を通ってサブスクリプションや請求アカウントを作って、Google Code Assistみたいなのを買わなきゃいけない。でもそうするとGeminiアプリが手に入らない。しかも、このGoogle AIはなぜかYouTube Premiumもくれるんだけど(これが何に関係してるのか全然わからない)。

AIがコーディングしてる間にYouTube見るの最高だね。

これについても気になってたんだけど、どうやら統合に向けて動いてるみたい。GoogleのAI Pro/UltraサブスクリプションでもAPI/CLIのクレジットがもらえるとかなんとか -- https://github.com/google-gemini/gemini-cli/issues/1427

それにしても、このGoogle AIがなぜかYouTube Premiumをくれるんだよね(どう関係あるのか全然わからないけど)。Googleのモデルに特有の一般的なテストの一つは、YT動画の理解なんだ。要約、トランスクリプション、ダイアリゼーションなど。彼らのAPIの一つでは、コンテンツを自分でダウンロードする代わりにYT動画のIDを提供できるんだ。

でも、他のUltraサブスクリプションの一部とは違って、YouTubeプレミアムを家族と共有できないんだよね。だから今、両方持ってるけど、Googleから何度か「それはやめた方がいいよ」って言われた。

早くからGoogle for Domainsを使ってて、自分のGoogle Workspaceアカウントを持ってる人は、本当に大変だよね。何もかもうまくいかないから。

AIと一緒にバンドルするのは、エンジニアが自分のYouTubeアカウントの広告をオフにしようとする厄介な内部問題に対処するためなのかな。

皮肉なことに、複雑なサブスクリプションプランは、人々が物を過剰に支払うのに効果的な方法だと思ってる。

2025年には真のエージェントは一つだけ、Claude Codeだよ。でも、Geminiは長いコンテキストを扱う能力がすごく高いんだよね。 -- https://www.reddit.com/r/ClaudeAI/comments/1miweuv/comment/n...

同じこと考えてる。Githubの承認プロセスが変化の間に入るのは嫌なんだよね。Claude Codeのキラーフィーチャーは、悪い方向に進む前にそれを止められることだし、その間に自分でコーディングできることなんだ。ジュニアに質問せずにフル機能を完成させさせるの?それとも、困った時にチェックインさせるの?

今のところ、君に同意だよ。Googleはベンチマークで好成績を出して、World Models Genie 3みたいな印象的なモデルをリリースしてるけど、Gemini CLIの提案や変更はちょっと型にはまりすぎてる気がする。まるで、タブとスペースの違いにこだわるOCDのコーダーみたいで、役に立つ機能を作ることよりもそっちを優先してる感じ。最近のプロジェクトでは、Google CLIがその日のトークンを全部、ESLintの設定を調整したり、モジュール化が必要ないコードをモジュール化したりするような些細なタスクに使っちゃった。対照的に、Claude Codeは僕のプロンプトをより良く解釈して、ユーザーのために実際の製品機能を出す手助けをしてくれる。多分、システムプロンプトの問題かもしれない。僕のプロンプトが原因で問題が起きてる可能性もあるけど、Claude Codeは僕の意図をよりよく理解してるみたい。

Source graph ampも結構いいけど、Claudeコードのような洗練さや機能は欠けてる。でも、特にコードレビューのために時々使うことがあるよ。o3に呼びかける「オラクル」ツールがあるからね。

実は、Julesを使ってサイドプロジェクト(React Nativeアプリ)を「コーディング」するのが結構楽しいんだ。最近は時間が限られてるけど、通勤中にアイデアや機能を考えたり、やりたいことを計画したり(時々はGitHubアプリで既存のコードを修正したり)して、いくつかのジョブを送るんだ。帰宅する頃にはいくつかのPRをレビューする準備ができてる。大半のコードは自分には役に立たないけど、だいたい動くし、アイデアを試すのにすぐに取り掛かれるから、後でちゃんと書き直すことができる。次のステップは、各PRに自動ビルドを追加すること。そうすれば、帰り道にスマホでいろんなブランチをチェックできるし、家に帰ってからiOSシミュレーターを動かすのを待たなくて済むんだ :D

これがまさに、superconductor.devを作った理由なんだ。各エージェントのライブアプリプレビューを提供してるよ。Claude Codeだけじゃなく、Gemini、Codex、Ampもサポートしてる。興味があったら、サインアップフォームにHNって書いてくれれば、優先的に対応するよ :)

ずっと放置してたGitHubリポジトリをつなげて、ちょっとしたことをいじってるだけなんだ。依存関係の更新とか、実際の実装詳細を変えずにコードをリファクタリングしたり、ちょっとした機能やスタイルの更新をしたりね。そういう使い方にはほとんど問題なく動いてるよ。でも、重要な開発を任せるかは微妙かな。

Julesをサイドプロジェクトで使ってみたけど、出てくるコードの質がGH Copilot(Claude Sonnet使用)、Gemini CLI、Claude Codeよりもずっと悪いんだよね(おかしいことに、Gemini CLIと同じモデルのはずなのに)。それに、モノレポで混乱する傾向があって、すでにバックエンドにいるのに「cd backend && $DO_STUFF」を繰り返そうとするんだ。すでにバックエンドディレクトリにいるのに、$DO_STUFFを変更しようとするばかりで、状況を理解しようとしないんだよね。

Julesを初めて使ってみたけど、データレイヤーを再構築するのがすごく上手だった。Copilotよりも期待以上だったかも。最初は感心してるけど、これがどれくらい持つか見てみよう。Copilotには感心してたけど、使ってるうちにすごく混乱したり、動きが遅くなったりすることがあって、結局時間を無駄にしちゃうんだよね。これが今のAIの現状だね。

Julesをサイドプロジェクトで使ってみたけど、出てくるコードの質がGH Copilotよりもずっと悪かった。もう一度試してみる価値はあるかも。「Julesは今、Gemini 2.5 Proの高度な思考能力を使ってコーディングプランを開発していて、より高品質なコードを出力している」

サイドプロジェクトでちょっとした変更(カラフルなターミナル出力を追加)をするのに使ったよ。PRは素晴らしかった。LLMコーディングエージェントは、いろんなことに秀でてるけど、ランダムに苦手なこともあるみたい。プロンプトを書いて、あとはPRが生成されるのを待つだけっていうのは楽だよね。それに、失敗しても大した痛手じゃないし、いつでも再プロンプトできるから。

このクラスのソフトウェアには「非同期コーディングエージェント」っていう言葉が好きだな。他にもいくつか使われてる例を見つけたから、これが定着することを願ってる。 - https://blog.langchain.com/introducing-open-swe-an-open-sour... - https://github.com/newsroom/press-releases/coding-agent-for-...

コードを書くのにLLMを使う経験はあまりないんだけど、最近始めたすごく整理されてないPythonプロジェクトでJulesを試してみたよ。コードは約800行。大規模なリファクタリングが必要だったから、Julesに提案をしてもらうように頼んだんだ。ざっと見た感じ、いい仕事してたよ。最初は失敗したけど、エラーメッセージを伝えたら直してくれた。そしたら、その後ちゃんと動いてびっくりした。無料プランにしては悪くないね。

ジュールズは数通のメッセージやプロンプトの後、ジェミニCLIみたいに無限ループにハマっちゃうんだよね。この2つの製品は、クロードコードに比べて、ほんとに限られた基本的な変更しかできてない。最悪なのは、ループからすぐに抜け出すための「STOP」ボタンがないことだよ。