2.5 Flashおよび2.5 Pro GAの制作と、Gemini 2.5 Flash-Liteの紹介

2025年6月18日原文(blog.google)

概要

Gemini 2.5 Flash と Pro が正式リリース
2.5 Flash-Lite のプレビュー版を発表
Flash-Liteは 最速・最安 の2.5モデル
開発者や企業による 実運用事例
Google AI Studio や Vertex AI で利用可能

Gemini 2.5 Flash・Proの正式リリース

Gemini 2.5 は ハイブリッド推論モデル ファミリー
コストとスピード のパレート最適化を追求
2.5 Flash と 2.5 Pro が 安定版 として一般提供開始
Spline や Rooms、 Snap、 SmartBear などが既に本番運用
安定版により 本番アプリケーション開発 の信頼性向上

Gemini 2.5 Flash-Liteのプレビュー提供

Gemini 2.5 Flash-Lite は 最速・最安 の2.5モデル
現在 プレビュー版 で利用開始可能
2.0 Flash-Lite よりも全体的に高品質
- コーディング、数学、科学、推論、マルチモーダルベンチマークで優秀
大量・低遅延タスク （翻訳・分類等）に最適
- 2.0 Flash-Lite や 2.0 Flash よりも低遅延
Gemini 2.5 の特長を継承
- 予算に応じた推論制御
- Google Search やコード実行などのツール連携
- マルチモーダル入力 対応
- 100万トークン のコンテキスト長

利用方法と今後

Google AI Studio、 Vertex AI で 2.5 Flash-Liteプレビュー 提供
2.5 Flash と Pro の安定版も同時利用可能
Geminiアプリ でも 2.5 Flash ・ Pro にアクセス可能
Google Search にもカスタム版のFlash-Lite・Flashを導入
開発者や企業による 新たな活用事例 への期待

Hackerたちの意見

ジェミニをコーディング以外でどう使ってるのか、みんなの意見を聞きたいな。なんでそれを選んだの？アプリを作って、基盤のGenAIを簡単に入れ替えられるようにしてるの？冗長性やコスト削減のために、他のプロバイダーに使用を分散させてる？もしLLMのスポットマーケットみたいなのができたら、どうなるんだろう？

└

シンプルな非構造データから構造データへの変換。FlashとFlash Liteは他のものよりも一貫性があって、本当に速くて安いと思う。他のプロバイダーに簡単に切り替えられるけど、今のところはそのつもりはない。大規模には運用してないからね。

└

私の経験では、ジェミニ2.5プロはCanvasを使った翻訳や要約などの非コーディングのユースケースで本当に輝いてる。巨大なコンテキストウィンドウと大きな使用制限が助けになってると思う。ジェミニはChatGPTよりも深いリサーチレポートを生成するのがずっと得意だと思う。Googleはウェブ検索で優位性があって、それが表れてる。ジェミニのレポートは膨大な情報源を参照してるから、より正確になる傾向がある。全体的に、私はそのライティングスタイルも好みだし、レポートをGoogleドキュメントにエクスポートできるのもいい。ただ、ジェミニのUIは競合に比べてかなり劣ってるのが残念。カスタムインストラクション、プロジェクト、一時的なチャット…これらの機能は、ジェミニには同等のものがなかったり、未発達だったりする。

└

NDAを山ほど投げても、数秒で関連する情報をきれいに引き出してくれる。広いコンテキストウィンドウと、はさみの中から針を見つけるパフォーマンスがこのタスクには最適だね。

└

ウェブスクレイピング - ひどいHTMLスープから半構造化データを作成すること。たまにはモデルを入れ替えるべきだけど、今のところGemini 2.0 Flashが価格とパフォーマンスのバランスがいいと思う。明日はGemini 2.5 Flash-Liteを試してみるけどね。

└

Gemini 2.5 Flash（思考しないやつ）を思考パートナーとして使ってる。自分の考えを整理するのに役立つし、思いつかなかった新しいアイデアをくれることもある。自己反省にも使ってて、自分の考えや心配事を入力して、何を言ってくれるか見るのが好きなんだ。

└

はい、内部でLLMと連携する別のサービスを実装しました。これで、呼び出し元はどのプロバイダーやモデルを使っているか気にしなくて済むんです。ただ、モデル間での負荷分散は必要なかったですね。

└

https://toolong.link のYouTube要約に画像を使うために使ってる。GeminiだけがYouTubeに簡単にアクセスできて、巨大なコンテキストウィンドウがあるからね。

└

Gemini Flash 2.0は、非常に低コストで絶対的に使えるモデルだね。知能の面ではフロンティアモデルには及ばないけど、低コスト、超高速、そして信頼性の高い構造化された出力生成の組み合わせがあって、開発がすごく楽しい。ここで2.5 Liteと比較してみるつもり。

└

Geminiの無料画像生成クレジットはまだ使い切ってないから、子供が遊びたいときや、質の高い結果を得るためにo4トークンを使う前にプロンプトをテストするのに使ってるよ。

└

https://lexikon.aiで広く使ってるよ。特にLexikonの一部は大量の画像を処理することに関わっていて、Googleのビジョンの料金は大手の代替品（OpenAIやAnthropic）と比べてかなり安いんだ。

一時期、AIスタジオでジェミニプロが無料になった時、たくさんの人が選んでたと思う。でもそれ以来、なんか悪化して、真面目な仕事にはまたクロードを使うようになった。ジェミニは、ずっと喋ってるけど実際には何を言ってるのか分からない男みたい。ブレインストーミングにはまだ使ってるけど、その提案はかなり疑ってかかってる。プロンプトを生成するのには役立つけど、それを洗練させてクロードと一緒に使ってる。

Hacker Newsで議論の続きを見る

ハクソク

2.5 Flashおよび2.5 Pro GAの制作と、Gemini 2.5 Flash-Liteの紹介

概要

Gemini 2.5 Flash・Proの正式リリース

Gemini 2.5 Flash-Liteのプレビュー提供

利用方法と今後

Hackerたちの意見