世界を動かす技術を、日本語で。

ジェミニ 3.5 フラッシュ

概要

Gemini 3.5 は、複雑なエージェント型ワークフロー実行のために設計された最新AIモデル。 3.5 Flash は、従来モデルより高速かつ高性能で、コーディングや業務自動化に強み。 Google AntigravityやGemini API を通じて、開発者・企業・一般利用者向けにグローバル展開。 Gemini Spark などのパーソナルAIエージェント機能も追加。 安全性強化 や現実世界での具体的な導入事例も多数。

Gemini 3.5 Flashの概要と特徴

  • Gemini 3.5 は、フロンティア知能と高度な実行力を融合した最新AIモデルファミリー。
  • 3.5 Flash は、エージェントやコーディング用途に特化した高速・高性能モデル。
  • Gemini 3.1 Pro を上回るベンチマークスコア(例:Terminal-Bench 2.1で76.2%、GDPval-AAで1656 Elo、MCP Atlasで83.6%)。
  • マルチモーダル理解 に強く、CharXiv Reasoningで84.2%を達成。
  • 出力トークン速度 は従来のフロンティアモデルの4倍。
  • 品質と低遅延 の両立。

3.5 Flashのエージェント型タスク実行能力

  • 長期的・複雑なタスク を短時間かつ低コストで実行可能。
  • Antigravityハーネス と連携し、協調的サブエージェントを展開可能。
  • マルチステップワークフロー やコーディングタスクを高い精度で実行。
  • 動的基準に基づく資産分類やリネーム、ゲーム開発、レガシーコードのNext.js移行などに対応。
  • マルチモーダル基盤 を活かし、リッチなWeb UIやグラフィック生成。

3.5 Flashの実世界での導入事例

  • Shopify :サブエージェントによる長期データ分析と成長予測。
  • Macquarie Bank :100ページ超の書類解析による顧客オンボーディング高速化。
  • Salesforce :複雑な企業向け業務自動化、マルチターンツール呼び出し。
  • Ramp :複雑な請求書のOCR精度向上と履歴推論。
  • Xero :1099税務書類対応など、管理業務の自動化。
  • Databricks :リアルタイム情報監視と大規模データセットの問題診断。

パーソナルAIエージェント「Gemini Spark」

  • Gemini Spark は、3.5 Flashを搭載したパーソナルAIエージェント。
  • 24時間稼働 し、ユーザーのデジタル生活を支援。
  • GeminiアプリAI Mode in Search でグローバルに展開。
  • β版 は米国のGoogle AI Ultra加入者向けに順次提供予定。
  • 検索やUI体験 の高度化にも貢献。

セーフティと利用環境

  • Frontier Safety Framework に基づき開発、安全性・解釈性を強化。
  • サイバー・CBRNリスク対策 を強化し、有害コンテンツ生成リスクを低減。
  • Gemini 3.5 Flash は、Google Antigravity、Gemini API、AI Studio、Android Studio、Gemini Enterprise各プラットフォームで利用可能。
  • GeminiアプリAI Mode in Search で一般利用者も即時アクセス可能。

参考リンク

Hackerたちの意見

ジャングルの川をボートで漕ぐカエルのアニメーションSVGを作成して。SVGの3.5 Flash: Thinking Medium - 7516トークン https://gistpreview.github.io/?5c9858fd2057e678b55d563d9bff0... 3.5 Flash: Thinking High - 7280トークン https://gistpreview.github.io/?1cab3d70064349d08cf5952cdc165... 3.1 Pro - 28,258トークン https://gistpreview.github.io/?6bf3da2f80487608b9525bce53018... 3.1は生成に3分かかったけど、アニメーションが動くのはそれだけだった。

あなたのリンク、壊れてるよ。

3つのリンク、全部アニメーションしてるよ。

「三匹の子豚」みたいなもっと複雑なストーリーで試してみてくれない?私もやってみたけど、SVGアニメーションじゃなくて絵本ができちゃった。Godogen [1][2]を部分的に真似したいんだけど、あれは本当に素晴らしいよ、アニメーションも含めて。 [1] https://github.com/htdt/godogen [2] https://drive.google.com/file/d/1ozZmWcSwieZQG0muYjbj7Xjhhlz...

Gemini 3.1 Flash Lite Thinking High - 2,526トークン: https://gistpreview.github.io/?3496285c5dac5ba10ebbc0b201a1a... Gemini 2.5 Pro - 5,325トークン: https://gistpreview.github.io/?cc5e0fefeaaffecd228c16c95e736... Gemini 2.5 Flash - 7,556トークン: https://gistpreview.github.io/?263d6058fe526a62b8f270f0620ec... Gemma 4 31B IT - 3,261トークン via AI Studio: https://gistpreview.github.io/?858a42b96af864859a3b89508619d... Gemma 4 26B A4B IT - 4,034トークン via AI Studio: https://gistpreview.github.io/?4adb7703897e0c6b583f9de928e4a...

hesamation/Qwen3.6-35B-A3B-Claude-4.6-Opus-Reasoning-Distilled-GGUF @ Q6_K 8112トークン @ 52.97 TPS, 0.85s TTFT https://gistpreview.github.io/?7bdefff99aca89d1bc12405323bd4... フルセッション: https://gist.github.com/abtinf/7bdefff99aca89d1bc12405323bd4... Macbook Pro M2 MaxでLM Studioを使って生成したよ https://huggingface.co/hesamation/Qwen3.6-35B-A3B-Claude-4.6...

Opus 4.7

これがGPT 5.5の高次思考だね。最初のプロンプトがアニメじゃなかったから、2つ目のプロンプト「でもアニメじゃないけど」を追加しなきゃならなかった。

これめっちゃ面白い。3.5 Flash Thinking Highだけ妙に変形してるよね(3.1 Proの帽子、どうなってるの??)

入出力トークンあたり: Gemini 2.5 flash: $0.30/$2.50 Gemini 3.0 flashプレビュー: $0.50/$3.00 Gemini 3.5 flash: $1.50/$9.00 面白い価格設定だね。次の同サイズモデルで3倍の価格上昇なんて見たことないし(3がプレビューしか出てないのは笑える)。3.5 flashは、$1.25/$10だったGemini 2.5 proと同じくらいのコストだね。

それらは本当に比較できるとは思わないな。Flash-Lite層を作ったのは、古いFlashモデルの代わりにするためみたいだね。

GoogleがTPUを使って他の誰よりも安い推論を実現してるなら、これはちょっと危ない匂いがするな。もしかしたら、LLMを利益を出しながら提供するのが難しいのかも。あるいは、ベンチマークが良いからって値上げできると思ってるのかもね。でも、まだその価格設定を正当化するだけの市場シェアは持ってない気がする。

3.5フラッシュはプレビューじゃなくて安定版としてリストされてるんだよね?それとも俺が読み間違えてる?

3.1フラッシュライト — $0.25/$1.50 — しかもめちゃくちゃ速い。3.1フラッシュライトは3フラッシュプレビューほど良くはないけど(あれは本当に素晴らしい安いモデル…大好きなんだ) — でも3.1は半額だし、その速さのおかげでいろんな使い方ができるようになる。比較すると、Opusモデルは$5/$25だね。

彼らは安いモデルをずっと提供し続けるつもりなんてなかったんだろうな。API上にサービスを構築した人たちがいるから、こうやって圧力をかけるのは自然な流れだよね。プロバイダーが重要じゃない抽象化レイヤーを持つのは理にかなってる。Kotlinで作業してるなら、Koogはすごくいいよ。

ジェネレーティブAIは利益が出てない、特に人を引き込むために提示してる信じられないほど安い料金ではね。だから、今後もっと値上げがあると思っておいた方がいいよ。

また「ディープシークモーメント」が必要だよ。そうじゃないと普通の人がAIを使うのは不可能になっちゃう。大企業だけが手が届くものになっちゃうよ。

彼らの理屈は、市場に対してサイズと知能が成長しているってことかもね。ちなみに、ほとんどのベンチマークでClaude Sonnetを上回ってるけど(ベンチマックス?)、トークン単位ではほぼ半額に設定されてる。問題は、この議論で誰かを納得させられるかってことだよね。Googleには本当にGeminiをClaudeやCodexより好む開発者が多いのかな?その辺の話、聞いてみたいな。

これはコストの増加を過小評価してるね。3.5 Flashはトークンももっと使うし。artificialanalysis.aiが全体の評価を実行するのに必要な違いを示してるけど、これがもっと現実的な価格だと思う。Gemini 2.5 Flash(スコア27):$172(1.0x)Gemini 2.5 Pro(スコア35):$649(3.8x)Gemini 3.0 Flash(スコア46):$278(1.6x)Gemini 3.5 Flash(スコア55):$1,552(9.0x、2.5 Proと比べて2.4x)これはすごい価格上昇だよ…Gemini 3.0 Flashと比べて5.6倍だし。

公平に言うと、Gemini 3.1 Flash _lite_は構造化出力(JSON保証)をサポートしてるし、めっちゃ速い。2.5 Flashよりも圧倒的に速くて、コストは$0.25/$1.50だよ。俺はこれを めっちゃ 使ってて、計画さえ正しくすればかなりの能力がある。実際、ほぼ専ら3.1 Flash Liteと2.5 Flash Lite(もっと安い)を使ってて、99.5%の精度を達成してる。とはいえ、ライト/フラッシュモデルとプロモデルは価格的にもっと分かれていくと思う。プロモデルはどんどん高くなっていくね。

知識のカットオフ:2025年1月 最新の更新:2026年5月 この遅れにはすごく悪い予感がする。

どういう意味か説明してくれる?

それってGoogleが決めた選択じゃなかったっけ?

少なくともいくつかのケースでは、より合成データや厳選されたデータでのトレーニングに移行しているように見える。特に知識が広範囲にわたらない小さなモデルの場合、モデルの重みを数十ギガバイトや数百ギガバイトに収めるスペースが足りないからね。だから、高品質な推論を達成するためには、トレーニングを集中させて、データの質と密度を非常に高くする必要がある。強力なツールを使えば、モデルが古いデータを使っていてもあまり関係ないかもしれない。彼らは最新の情報を検索できるし。ただ、現在のほとんどのモデルは、その方向に少し押してあげないとそうはならないけどね。また、Qwen 3シリーズはすべて同じベースモデルに基づいていて、さまざまな指標を改善するために微調整やポストトレーニングを行っていると思う。Gemini 3シリーズのすべてが同じかもしれないし、今まさにGemini 4のベースモデルを最新の知識で同時にトレーニングしている可能性もあるね。

彼らに重みから事実を引き出させるのは本当に良くないよ。リアルなデータソースからの基盤が必要だよ。

ペリカンはすごいけど、バイクとしてはイマイチだね。ペダルと後輪の間のバーを忘れちゃったし、他のバーも変に絡まってるし。しかも高い!そのペリカン、13セントもしたんだよね。

あのペリカン、マイアミでクリプトカンファレンスに参加してるみたいだね。

ジェミニモデルのいつもの問題だね、すべてを「豊かに」しようとするやつ。

人間より10ドルぐらい安いね。

これはllmの進歩に関して気づいたことを完璧に示してるね。こんな感じのSVGを改善するように頼むと、欠けてるバーや切断された部分を直さずに、ただ余計なものを足すだけなんだ。この例では明らかに大きく改善されてるし、すごい量のディテールがあるけど、フレームの基本的な形を間違えてるのは変だよね。パターンはどこにでも現れるし、ウェブページで試してみるとボタンや余計なものが増える。壊れたペリカンのSVGを画像モデルに食わせて欠陥を探してみたけど、壊れた要素を見つけられなかった。編集:人間の幻覚を修正した。

同じプロンプトを試したら、ジェミニはSVGじゃなくて画像を生成した。なんかおかしいな。

なんか、Googleの「ダサいけど若者にアピールしようとしてる」感じをうまく表現してる気がする。

ある時点で、基準を変えないといけなくなるよ。これがモデルのトレーニングセットに入っちゃうからね。

自転車を描いてってランダムな人に頼むと、チェーンステイを忘れるのが典型的だよね。 > ほとんどの人が普通の男性用自転車からかなり離れたものを描いちゃった。

この太陽、OS博物館についての他のトップHN投稿の背景にあるやつにすごく似てるね: https://news.ycombinator.com/item?id=48195009

ジェミニ3.5フラッシュの2000トークンの時計、悪くないよ。

俺ってそんなに年取ったのかな?「Flash」って言われたら、すぐに「HTML5を考えた方がいいよ」って返しちゃう。

Flash文化の楽しさのほとんどがHTML5には引き継がれてないね。

笑った。若い子たち!Flash、ああ、宇宙の救世主。Flash、ああ、彼が私たち全員を救ってくれる!何年も「フラッシュ」って言葉を聞いてきたけど、毎回こんな感じだよね。

Flashのデザイナーは本当にいい人だった。ウェブがちょっと遅れさせたのは、90年代と2000年代のRADツールたちだよね。

似たようなモデルで3倍の値上げだって。AIはもっと安くてどこにでもあるって言ってたのに。

クラック中毒のようにどこにでもあるね。

もし彼らのベンチマークを信じるなら、(3.1 Proの)価格の3/4ってところかな。

GoogleのAIプロプランを使ってて、3.5 Flashでアンチグラビティを試したけど、2つのプロンプトで全部のクォータを使い切っちゃった。これがバグじゃないなら、マジで使えないね。

アンチグラビティのモデルのデモで、ビジョンを使って非構造化アセットを自動で名前付けしてカテゴライズするのがかなりクールだった。IDEのサイドパネルがコーディングだけじゃなくてもっと色んなことに使えるってことを示してるね。アンチグラビティのハーネスはGemini CLIに基づいてるのかな、それとも全然違うのかな。Gemini CLIでも同じ作業ができるの?それともビジョン機能はアンチグラビティ特有のもの?

これ面白いな、今日ランダムにGeminiを使ってたら、Flashからのレスポンスがめっちゃ良くて驚いた。これが理由なんだろうね。