もう約1ヶ月続いてるけど、いつもの憶測の中でいろんなチェックポイントがあるね。今のところ、公式発表を待ってから判断した方がいいと思う。リリースプランがどうなるのか、チェックポイントがPro、Flash、Flash Liteの代わりになるのか、新しいモデルのカテゴリーなのか、全くリリースされないのか、などはわからないからね。もっと重要なのは、AIStudioのA/Bテストのやり方によって、得られる出力は単一のプロンプトに対するものだけだってこと。個人的には、スピードやレイテンシ、プロンプトの遵守について基本的な理解を得る以外は、単一のプロンプトからの出力は日常のパフォーマンスを測るには良い指標じゃないと思ってる。もちろん、マルチファイルの取り込みやツールコールの扱いについては何も教えてくれないし、ハイプはハイプだよね。単一プロンプトのA/Bテストの出力だけでパフォーマンスを評価する人がいるのは、モデルのパフォーマンスを評価する際のプロ意識の欠如を示してると思う。Gemini 3.0モデルが競争力を持つ可能性があるとは言ってないけど、過剰な期待や失望に巻き込まれないように警告したいだけ。だから、一般的に憶測的なコンテンツが嫌いなんだ。適切な文脈に置かれることが少ないから、あまり目を引かないんだよね。