世界を動かす技術を、日本語で。

Gemini CLI GitHub Actions

概要

  • Gemini CLI GitHub Actions は、AIによるリポジトリ作業自動化ツール。
  • 無償で提供 され、チームコラボレーションに最適化。
  • 課題トリアージやプルリクレビュー など主要なワークフローを自動化。
  • 高いセキュリティ と柔軟な権限管理を実現。
  • オープンソース でカスタマイズ可能、すぐに利用開始可能。

Gemini CLI GitHub Actions:AIコーディングチームメイトの登場

  • Gemini CLI GitHub Actions は、リポジトリ管理のための AIコーディングチームメイト
  • 自律型エージェント としてルーチン作業を自動実行、 オンデマンドで作業委任 も可能。
  • ベータ版として全世界で利用可能、GitHubリポジトリ(google-github-actions/run-gemini-cli)で公開中。

チームコラボレーションへの最適化

  • Gemini CLI は個人向けターミナルツール、 GitHub Actions版 はチーム作業に特化。
  • 新規課題やプルリクエスト等のイベント で自動的に動作、 非同期でタスク処理
  • プロジェクト全体の文脈を理解 し、適切な対応を自動で実施。

三つの主要ワークフロー

  • インテリジェント課題トリアージ
    • 新規課題を 分析・ラベリング・優先順位付け、重要事項に集中可能。
  • 高速プルリクエストレビュー
    • コード変更に対し 品質・スタイル・正確性 を即時フィードバック。
    • 複雑な判断や高度なレビューに人的リソースを集中可能。
  • オンデマンドコラボレーション
    • @gemini-cli を課題やPRでメンションし、タスクを指示。
    • 例:「このバグのテストを書いて」「上記の変更を実装して」「代替案を検討して」「明確なバグを修正して」等。
    • 新機能リクエストも簡単作成、Gemini CLIが対応。

カスタマイズ性と拡張性

  • 初期ワークフローはオープンソースかつカスタマイズ可能
  • 独自ワークフローの作成や既存ワークフローの設定変更 も容易。

エンタープライズグレードのセキュリティと制御

  • 堅牢なセキュリティ柔軟な権限管理 を実装。
  • 安全な認証 :Vertex AIやGemini Code Assist利用者は Workload Identity Federation 対応、APIキー不要でリスク低減。
  • 細かな権限設定コマンド許可リスト で実行可能コマンドを明示制御。
    • 独自アイデンティティ作成 で最小限の権限のみ付与可能。
  • 完全な透明性OpenTelemetry 統合により、 Google Cloud Monitoring 等の監視基盤へログ・メトリクスをストリーミング。
    • リアルタイムで全アクションを可視化、ワークフローのデバッグや利用状況監視が容易。

Gemini CLI GitHub Actionsの始め方

  • Gemini CLI 0.1.18以降をダウンロード し、/setup-githubコマンドでセットアップ。
  • GitHub Actionはgoogle-github-actions/run-gemini-cli で入手可能。
  • Google AI Studio向け無償クォータ 提供、 Vertex AI・Gemini Code Assist(Standard/Enterprise) もサポート。
  • 個人向けGemini Code Assistも近日無償提供予定
  • リリースノート自動生成やドキュメント同期 等、独自ワークフロー作成・コミュニティへの共有も推奨。

まとめ

  • Gemini CLI GitHub Actions は、 AIによるリポジトリ作業自動化とコラボレーション強化 を実現。
  • 無償・高セキュリティ・高カスタマイズ性 が特徴。
  • 今すぐ導入・活用が可能、新しい開発体験の創出。

Hackerたちの意見

  1. Google OneとUltraプラン、Workspaceプラン用のGemini これらのプランは、現在Googleが提供するGeminiのウェブベースの製品(例えば、GeminiウェブアプリやFlowビデオエディタ)での使用にのみ適用されます。Gemini CLIを支えるAPIの使用には適用されません。これらのプランをサポートすることは、今後のサポートについて検討中です。やっぱり、サブスクリプションが複雑すぎる。開発者向けに、月額制で好きなだけ払えるプランを用意してくれれば、Gemini CLIやこのGitHubアクション、Geminiチャット、Julesとか使えるのに。Claudeのマックスサブスクリプションみたいに。これがあれば、私にとってはゲームチェンジャーになるよ。リリースおめでとう!これ、めっちゃクールだね!

AIにサブスクリプションを理解してほしい。

正直、Geminiの無料プランにはちょっと混乱してる。いろんなエージェント(AiderとかCrush)で使ってみたけど、すぐにレート制限に引っかかっちゃう。5、6回リクエストしただけで、もうダメになる。何度か再試行できるけど、また制限に達しちゃう。最終的には、日々の制限に達して、次の日まで使えなくなる。確かに、エージェントベースの開発を試すには十分楽しめたし、感謝してるけど、> 「彼らが言うように、寛大な無料枠」と自分の体験を照らし合わせるのが難しい。5分で使えなくなるのがそんなに寛大なの?(今朝、Crushに入力した一文が、APIを何度も呼び出して、結局レート制限に引っかかっちゃった。まあ、リクエストが多かったのかもしれないけど、ほんの小さな仕事を頼んだだけで終わらなかった。)その一方で、Geminiのウェブアプリは無限に使えて、まだ制限には引っかかってないみたい。

ちょっと待って、これはCLIなの?それともGitHubアクション?それともGitHubアプリなの?それに、Julesは彼らが取り組んでいる「コーディングエージェント」だと思ってたんだけど、これがそれを引き継ぐの?それともGoogleが自社競争してるだけ?この会社には強いビジョンを持った人が必要だよ。全体的にバラバラで、リソースを分散させすぎてるから、顧客やブランドの価値も薄まっちゃう。私みたいな人間が言うのもなんだけど: - Androidのコードを書いて約13年 - Googleといろいろコラボしてきた - Googleの開発者コミュニティやカンファレンスをリードしてきた - たくさんのGDEと話をしている - 自分の製品にGemini APIを使っている こんなに混乱してるのに、普通の顧客はどうやって理解すればいいの? - Gemini APIにアクセスするためのSDKが2つある。 - ドキュメントが散乱してる。 - 何かをしようとすると、コードを掘り下げないといけないことが多い。 - 本当に欲しい機能はレート制限されてたり、プライベートテスターだけに提供されてたりする。 - 今は3つのコーディングエージェントがいる。 - Googleアカウントや電話にアクセスできるのに、Geminiアプリは役に立たない。 - 最近、Google Cloudで基本的なこと(サービスアカウントの追加)をしようとしたけど、デフォルトのルールが廃止されてて、変更するのがすごくわかりにくかった。唯一使えるのはAIスタジオで、これはいろんなモデルを試すのに良いツールだし、Gemini APIキーを取得するのもかなり楽になった。リリースおめでとうと言いたいけど、正直言ってこれはかなり簡単に手に入る製品だと思う。

彼らは全体的にバラバラで、リソースを分散させすぎてる まあ、広げるものがたくさんあるからね。でも、確かに重複が多すぎる。

彼らが私のGoogleアカウントや電話にアクセスできるのに、Geminiアプリは役に立たない。 これ、私には一番面白いことだよ。アプリを開くと、Geminiが「こんにちは、Vasco」と言うウェルカム画面が出る。そこで、この素晴らしい知能に「私の名前は何?」って聞いてみたら、「あなたの名前はわかりません。私はAIで、あなたの個人情報にはアクセスできません。」って。理由はわかるけど、めっちゃ面白い。

これ、普通のgemini cliと同じように認証できないみたいで、APIキーが必要みたいだから、OAuthを通じた無料、スタンダード、エンタープライズプランでは現在認証できない。Google AI Studioの無料プランだけが使えるけど、これはgemini-cliの無料プランとは違って、レート制限が厳しい。

私の考えでは、Googleには「インキュベーション」スペースがたくさんあって、そこでチームが何かを作っているんだよね。それが成功するかどうかは分からないけど、成功すると逆にその成功が足かせになっちゃうこともある。人々を混乱させるのは、他のGoogle製品と上手く馴染まない「コア」な製品じゃないからだと思う。NotebookLLMもその一例みたい。個人的には、Googleがこういう実験を続けてくれる方がいいと思うけど、もしかしたら間違ってるかもしれない。でもNotebookLLMの後、開発チームはかなりの自由度を持っているように見えた。

gemini-cliは、Geminiを呼び出して一般的なテキストユーティリティやMCPを使うためのコマンドラインツールだよ。これは単なるプラグインみたいで、GitHubで何かをやると、クラウド上で動いているgemini-cliに通知が送られて、gemini-cliが応答して通知を返す仕組み。要するに、特定のコミットをクローンしたり、手動でgemini-cliを呼び出したり、結果を手動でアップロードする手間を省いてくれるってこと。

彼らは研究文化とソフトウェア文化の間に境界を設ける必要があるね。一つの組織で二つの文化。君が言う混乱は、実は研究環境ではかなりポジティブなことなんだ。薄く広げるのではなく、多様化して努力を相関させないことだから。すべてのイノベーションを中央で計画することはできない。でも、顧客と研究成果のインターフェース、つまりソフトウェアや製品の問題に関しては、確実に別のアプローチが必要だよ。

JulesはVMの中で、非同期にコードの別のチェックアウトで作業してる。Gemini CLIはユーザーと同期して動作する(YOLOしない限り)し、自分のマシンの自分のディレクトリで自分のチェックアウトで動いてる。全然違うモードだね。

それに、Google Workspaceを使ってるなら、そこでも全てが変わるよ。Gemini CLIを有効にするのは、全体の組織に提供しようとすると、泣き笑いの絵文字みたいな感じになるね。

もう認めざるを得ないよ、彼らは会社の「Yahooフェーズ」に入ったんだ。いい長い期間だったけど、残るのはどんどん大きな成功したスタートアップを買収して、粉々にするだけ。プロジェクトの「サンセット」、良いものも悪いものも、何でもランダムにアプローチすること、徐々に枯渇していく素晴らしい製品の島々…これは管理構造の失敗であって、単なる管理の問題じゃない。Googleの内部事情は知らないけど、500人のVP(またはそれに相当する人)がそれぞれのペットプロジェクトを持っていて、「Geminiを大きくするように」ってメールを送ったボスに気に入られようとしてるんじゃないかな。多くのチームが古い壊れたプロジェクトを放り出して、新しいホットなものに移行しているように感じる。顧客や一貫性、収益なんてどうでもいいって感じ。今の唯一の指標は「Geminiのエンゲージメント」だね。

何かが実際に何であるかを理解するために調査に費やさなければならない時間の多さには、いつも驚かされる。バズワードや不適切な説明、不要な冗長なものを取り除くのが面倒で...本当に疲れる。だから、これが何なのかと思う:GitHubのワークフローYAMLファイルに含められるGitHubアクション。Gemini CLIを実行して、プロンプトやリポジトリのコンテキスト、イベントデータ(例えば、イシューのテキストやPRの差分)を渡して、レスポンスを生成したりアクションを実行したりする。つまり、GitHub Actions環境内でGemini CLIをインストールして実行するためのラッパーだ。GitHubのAPI(トークンやアプリを通じて)を使ってリポジトリデータ(イシュー、PR、コード)を読み書きできる。標準のHTTPS APIエンドポイントに対してGemini LLMに呼び出しを行う(CLIのバックエンドがGoogleのGemini APIとやり取りする)。

「チャットインターフェースでこれとあれを書け」って書いてあるけど、チャットインターフェースって何?

もし合ってるなら、最近のボリス・チェルニーとキャサリン・ウーのインタビューで、AI支援のCLIの振る舞いに関するセマンティックリンティングについてちょっと話してるよ。ここで聞けるよ: https://www.youtube.com/watch?v=zDmW5hJPsvQ&t=1760s まだこのCCの使い方は試してないけど、CI/CDでAI支援のCLIを使ってる人いる?自動PRレビューじゃなくて、MRをセマンティックに通すか落とすか、またはCI/CD中にターミナル対応のマルチコンテキストの使い方とか。

なんでこれを「gemini cli」って呼ぶのか不思議だな。主にGitHubを通じて使われるのに、もうCLIじゃないよね?Claude Codeの命名規則に従って「gemini github action」か「run gemini」って呼べばいいのに。

同じことを考えたよ。名前を付けるのは難しいけど、ここでは本当にひどい名前になっちゃってるね。

おそらく、Gemini CLIチームが作ったもので、組織のプレッシャーからこの名前が付けられたんじゃないかな。クレジットを確保するためか、非常に広い製品領域を占有しているように聞こえないようにするためか。

これは完全にローカルなGemini-CLIのアドオンだよ。

GitHub ActionのVMにgemini-cliをインストールして、問題やPRからのコメントをgemini-cliへのプロンプトとして渡すんだよ。

カルーセルの3枚目の画像のテキストが面白いと思った: > 「@ mini-cli」タグで仕事を委任すれば、エージェントがバグを書くことから修正することまで、さまざまなタスクを完了できる。

意外とその間に修正されてないね。もしかしたら、正直だったのかも。

Copilot Agentは本当に良い結果を出してる。時々PRを閉じて問題を洗練させたり、ローカルでカーソルを使って作業する必要があるけど、たくさんのことをスタートさせてくれる。

昨年、実はGithub PRのためのバウンティプラットフォームに取り組んでたんだ。私たちが提供したインセンティブのせいで入ってきた質の低い人間が書いたPRと、AIで数セントでドラフトPRが作れるってことがあって、このコンセプトは私にとっては完全に行き詰まってしまった。オープンソースのコードベースに注目とアクションを得ることの痛点は、もう関係ないと思う。むしろ、提案の嵐の中で限られたレビュアーやメンテナーのバンド幅をどう最適化するかが新たな痛点になってる気がする。そこで、主要なエージェントからPRを構築するフレームワークを試してるんだけど、タスクやレビューのプロセスをどう構造化してレビュー→受け入れ/修正のサイクルを最適化するかに焦点を当ててる。興味があれば、ここにいくつかのケーススタディを書いてるよ。

GoogleがコーディングAIで競争する必要があるって感じてるのは理解できる。でも私にとっては、すごくおかしなことがある。- Geminiは、来週の30分間に自分と他の人とのカレンダーの予定を作れない。まだ予定を作れないんだよ。- Googleドキュメントで編集やコラボレーションができず、挿入するだけ。私は自分のドキュメントをclineやClaudeのコードでマークダウンとして編集してアップロードしてる。- それに、ドキュメントやシートと連携するためのMCPがないと思う。- Geminiはシートの数式を手伝うのにGoogle検索よりも劣ってる。GoogleのエコシステムにはAIで優れているべきユニークな場所がたくさんあるのに、全然ダメだよ。昨日、数年前のremarkableの予約を探してたら、Gmailで正確な文字列検索ができなくなってることに気づいた。「remarkable」を検索すると「素晴らしい」が出てくる。彼らは自社の製品を愚かさに向かって劣化させてる。私とAIがもっとパワーツールを使える時にね。

うん、Google DocsでGeminiを試してみようと思ったけど、こんなに制限があるなら、なんでやるんだろう?

実は、スマホでGeminiを使って画面の詳細から予定を作成してるんだ。例えば、配達が来るから、日付と時間の範囲が書かれたメールがあるんだ。電源ボタンを長押しするとGeminiが出てくる。画面のコンテキストを使うボタンを押して、「これをカレンダーに入れて」と言うと、ちゃんと入れてくれる。完璧ではないけど、複数の日にまたがるイベントや、説明の中の変な場所の詳細が含まれないこともあるけど、そういうのはどんどん少なくなってる。Androidのスマホを使ってるから、もしかしたらそれがうまくいく理由かも。あと、「ほぼ動く」ってのは「いつも動く」とは違うよね。Google Workspaceのユーザーなら、Geminiのウェブアプリにワークスペースを接続できるよ。そうするとカレンダーやドライブを検索したり操作したりできる。ドキュメントを要約したり、他のいくつかのタスクもこなせる。私はあまり使わないけど、「予定を作れない」ってことはないよ。

まだ予定を作れないよ。 - Googleドキュメントの編集やコラボレーションはできなくて、挿入だけなんだ。できると思うけど、重要なドキュメントを自動で編集するリスクが大きいからオフにしてるんだろうね。

全く同感。genai/vertexaiのSDKを使おうとしたけど、行き詰まりや壊れた仕様、混乱ばかりだった。古典的なcurlはちゃんと動くみたいだけどね。

GoogleがGeminiをドキュメントに使わせないのは、AppleがAIをスマホに使わせないのと同じ理由だと思う。99.99%の人が使えるほど信頼性がないから。最前線にいる私たちは、微調整して不一致と向き合ってるけど、頑張れば生産性が上がる。家族の「テクサポ」をしてる人を思い浮かべてみて。(誰のことか分かるよね)その人に勧める?うん、私も無理だな。

本当に同意。GeminiにGoogleドキュメントでコラボレーションさせる方法を探すのに、ほぼ1時間もかかって驚いたよ。単に持ち方が悪いだけだと思ってた。これが機能じゃないなんて信じられなかった。諦めた時でも、もしかしたら自分のアカウントが正しいプランじゃないのかもって不安だった。

これには100%同意だわ。こういう小さくて便利な使い方が本当にたくさんあるよね。昨日も、パートナーが買い物リストのプリントを忘れちゃったから、写真を撮ってGeminiに頼んで特定のToDoリストアプリにコピー&ペーストできる形式に変換してもらったんだ。でも、GeminiはリストをGoogle Keepに放り込んじゃって、フォーマットがめちゃくちゃだった。アイテムは一つも抜けなかったけど、アイテムのカテゴリ(例えば、野菜と冷凍食品)を認識してくれなかった。だから、私の考えでは、まだまだ「粗削り」な使い方がたくさんあって、もっと良いプロンプトやコンテキストで整理できると思うし、Geminiチームがその辺を優先してくれればいいな。実際に必要なのは、リリースの便利な使い方をもっとアピールするマーケティングチームだと思う。OpenAIはTikTokでバンバン宣伝してるけど、30歳未満の人たちに会うと、Geminiの存在すら知らない人が多いんだよね。私の経験では、Geminiはやるべきことに関してはChatGPTよりも優れているし、OpenAIのマーケティングチームがTikTokで常に見せているようなこともできるよ。

より良いインデックスが必要だね。検索を純粋な埋め込みに切り替えたみたいだけど、うまくいってない。パフォーマンスの良いハイブリッド検索を作るのは難しいんだ。インデックスを組み合わせることができないからね。理想的には、埋め込み、テキストマッチ、品質ベクトルみたいなものが必要なんだ。これらを使ったPoCはうまくいったけど、スケールさせるのは合理的なレイテンシーで難しい。もしこんなのが存在するなら、ぜひ教えてほしい。これがあれば、たくさんの製品が良くなると思うから。

スキルの問題かもしれないけど、CursorでGemini 2.5 Proを何度か試したけど、毎回考えることが多すぎて、行動はほとんど(しかも間違ってることが多い)って感じ。Claude Sonnetの方が安くてずっと効果的だよ。GHAの統合があまり変わらないとは思えないな。

これのセットアップがめっちゃ混乱する。CursorのBugbot(あとCopilotもだけど、あれはGitHub自身のやつ)では、ほんの数クリックでできたんだけど、ここではGitHubにインストールするコマンドラインツールが必要で、さらにGoogle Cloudプロジェクトも必要なんだよね?