Google は、Gemini 2.5 Flash と Flash-Lite の最新プレビュー版をリリースしました。これにより、指示追従性やマルチモーダル能力が大幅に向上しただけでなく、コストと遅延も著しく削減されました。このアップデートは、開発者がより少ない労力でより多くのことを達成できるようにすることを目的としており、新しい
-latestエイリアスは開発ワークフローを簡素化します。
より強力で効率的な AI モデルを追求する中で、Google は歩みを進め続けています。同社は、Gemini 2.5 Flash と 2.5 Flash-Lite の最新アップデート版を発表しました。これらは現在、Google AI Studio と Vertex AI で試用できます。このアップデートの核心的な目標は明確です。出力品質を継続的に向上させながら、モデルの運用効率を大幅に改善することです。
簡単に言えば、この動きは AI をより賢くするだけでなく、より速く、より安価にすることを目的としています。
以下のグラフデータから、新しいプレビューモデルが知能(Artificial Analysis Intelligence Index)とエンドツーエンドの応答時間の間の優れたバランスを達成しており、現在の安定版と比較してパフォーマンスが大幅に向上していることが明確にわかります。
表 1:知能 vs. エンドツーエンド応答時間
| モデルバージョン | 知能指数(高いほど良い) | エンドツーエンド応答時間(秒、低いほど良い) |
|---|---|---|
| Gemini 2.5 Flash-Lite STABLE (No Thinking) | ~30 | ~2.5 |
| Gemini 2.5 Flash STABLE (No Thinking) | ~40 | ~3.5 |
| Gemini 2.5 Flash-Lite 09-2025 (No Thinking) | ~47 | ~5.0 |
| Gemini 2.5 Flash 09-2025 (No Thinking) | ~42.5 | ~2.0 |
| Gemini 2.5 Flash-Lite STABLE | ~40 | ~7.5 |
| Gemini 2.5 Flash STABLE | ~50 | ~15.5 |
| Gemini 2.5 Flash 09-2025 | ~53 | ~10.0 |
表 2:出力トークン効率
| モデルバージョン | 出力トークン |
|---|---|
| Gemini 2.5 Flash (09-2025) | 71M |
| Gemini 2.5 Flash STABLE | 93M |
| Gemini 2.5 Flash-Lite (09-2025) | 70M |
| Gemini 2.5 Flash-Lite STABLE | 140M |
Flash-Lite:より正確に、より簡潔に、そしてより強力なマルチメディア機能
最新バージョンの Gemini 2.5 Flash-Lite は、開発者が最も関心を持つ 3 つのテーマを中心に包括的なアップグレードが行われました。
- より正確な指示追従性: AI が複雑な指示を部分的にしか理解できないことがあるという問題に対処するため、新しいバージョンの Flash-Lite は、複雑な指示やシステムプロンプトの理解において大きな進歩を遂げ、要求をより正確に実行できるようになりました。
- 冗長ではなく、簡潔に: 古いモデルは、時として長すぎる回答を提供し、遅延とトークンコストを増加させていました。このアップデートにより、モデルの冗長性が大幅に削減され、より簡潔で正確な回答を提供できるようになりました。これは、高スループットを必要とするアプリケーションシナリオにとって大きなメリットです。実際、出力トークン数(つまりコスト)は 50% 削減されました。
- より強力なマルチモーダルおよび翻訳機能: Flash-Lite は、より正確な音声テキスト変換、より深い画像理解、よりスムーズな翻訳品質など、マルチモーダル機能が強化されました。
開発者は、次のモデル文字列でテストを開始できます。
gemini-2.5-flash-lite-preview-09-2025
Flash:AI アシスタントの包括的な進化
この 2.5 Flash モデルのアップデートは、Google が開発者コミュニティから受け取った 2 つの核心的なフィードバックに直接応えるものです。
- より賢いツール使用: Google は、モデルがツールを使用する方法を改善し、複雑で多段階のエージェントアプリケーションを処理する際のパフォーマンスを向上させました。これにより、AI はより複雑なタスクを単独で完了できるようになります。重要な SWE-Bench Verified ベンチマークテストでは、新しいモデルのパフォーマンスは 48.9% から 54% へと 5% 向上し、大幅な改善となりました。
- より高い効率、より低いコスト: 新しいモデルは、非常に高いコスト効率を提供し、より少ないトークンとより短い遅延時間で、より高品質の結果を生成します。グラフは、Gemini 2.5 Flash の出力トークン数が 24% 削減されたことを示しており、これは直接的なコスト削減を意味します。
初期のテスターからは、すでに多くの肯定的なフィードバックが寄せられています。たとえば、自動化 AI エージェント企業 Manus の共同創設者兼チーフサイエンティストである Yichao ‘Peak’ Ji 氏は、次のように述べています。「新しい Gemini 2.5 Flash モデルは、速度と知能を完璧に兼ね備えています。当社の社内ベンチマークテストでは、長期計画のエージェントタスクを処理する際に 15% のパフォーマンス向上が見られました。その優れたコスト効率により、Manus は前例のない規模にまで拡大することができます。」
このバージョンを体験するには、次のモデル文字列を使用できます。
gemini-2.5-flash-preview-09-2025
開発者向けに設計:-latest エイリアス時代へようこそ
Google は、過去 1 年間の経験から、モデルのプレビュー版をリリースすることで、開発者が最新の機能やイノベーションをいち早くテストし、貴重なフィードバックを提供できるようになり、それがより安定した優れた公式版 Gemini の作成に役立つことがわかったと述べています。
開発者が最新のモデルに簡単にアクセスできるようにし、長いモデル文字列を追跡する手間を省くために、Google は各モデルファミリーに -latest エイリアスを導入しました。このエイリアスは常にそのファミリーの最新モデルバージョンを指すため、開発者はアップデートのたびにコードを変更することなく、新しい機能を簡単に試すことができます。
開発者は、次の方法で新しいプレビュー版を使用できます。
gemini-flash-latestgemini-flash-lite-latest
開発者が安心してテストできるように、Google は -latest の背後にある特定のバージョンを更新または非推奨にする前に、2 週間前に電子メールで通知します。ただし、これらは単なるモデルエイリアスであり、レート制限、コスト、利用可能な機能はバージョンのリリースによって変更される可能性があることに注意してください。
アプリケーションに高い安定性が必要な場合は、Google は開発者が gemini-2.5-flash や gemini-2.5-flash-lite など、明示的にバージョンを指定したモデルを引き続き使用することを推奨しています。
Google は AI の無限の可能性を探求し続けます。今回のリリースはその前進の一歩にすぎず、今後さらに多くのニュースが発表される予定です。


