Google 又出招了?Gemini 2.5 Pro 預覽版登場,程式碼能力號稱輾壓群雄!
AI 圈風雲再起!Google AI 悄悄釋出最新的 Gemini 2.5 Pro 預覽版,不僅速度、創意大升級,更在程式設計和推理能力上直接叫陣 OpenAI、DeepSeek。這場 AI 大戰的戰火,顯然又被點燃了。
最近 AI 領域的步調快得讓人幾乎喘不過氣,你可能才剛搞懂上個月某家公司發布的新模型,轉眼間,新的挑戰者又站上了舞台。沒錯,這次的主角就是 Google。
他們最近無預警地推出了 Gemini 2.5 Pro 的最新預覽版,直接投下一顆震撼彈。Google 官方宣稱,這個版本不只是快,在創意、程式設計和推理能力上,更是全面超越了過往版本,甚至把矛頭指向了市場上的頂級對手。
這不是演習,Gemini 真的又變強了
你沒看錯,這不是一次小小的更新。還記得今年三月 Gemini 2.5 Pro 首次亮相,以及五月 I/O 開發者大會上的那次升級嗎?當時 Google DeepMind 的執行長 Demis Hassabis 才信誓旦旦地說,I/O 大會的版本是他們「有史以來最強的程式設計模型」。
結果話才說完沒多久,這個代號為「Preview 06-05」的新版本又橫空出世,而且據說比 I/O 版更強悍。很明顯,Google 的目標非常明確:打造一個能滿足最嚴苛企業級應用需求的強大模型。
數據會說話:跑分排行榜上的新王者?
老實說,光說不練是沒用的,我們直接來看數據。這次 Gemini 2.5 Pro 的升級可不是空穴來風,在幾個關鍵的基準測試中,它的表現確實驚人。
根據 Google 公布的效能圖表,我們可以清楚看到:
- 程式設計能力 (Coding - Aider Polyglot): Gemini 2.5 Pro 以 82.2% 的分數,擊敗了 OpenAI o3 (79.6%)、Claude Opus 4 (72.0%) 和 DeepSeek R1 (71.6%)。這意味著在撰寫和理解程式碼方面,它可能真的技高一籌。
- 科學能力 (Science - GPQA): 在這個需要高度專業知識的領域,Gemini 2.5 Pro 拿下了 86.4% 的高分,同樣領先 OpenAI o3 (83.3%) 和其他對手。
- 推理與知識 (Reasoning & knowledge - Humanity’s Last Exam): 這個號稱「人類最後的考試」的困難測試中,Gemini 2.5 Pro 以 21.6% 的成績險勝 OpenAI o3 的 20.3%。
除了這些,在 LMArena(一個衡量模型受歡迎程度的平台)和 WebDevArena(專注於網頁開發能力)的測試中,分數也分別提升了 24 分和 35 分,直接衝上了排行榜的前段班。這些數據都指向一個事實:Google 這次是帶著滿滿的信心來的。
不只會寫扣,還更有「人味」了
一個好的 AI 模型,光有強大的運算能力還不夠,它的回應方式、風格和結構也同樣重要。你知道的,有時候跟一個冷冰冰的機器對話,感覺真的很差。
Google 在官方部落格中特別提到,他們根據早期版本收到的使用者回饋,針對 Gemini 2.5 Pro 的「風格」和「結構」進行了改良。這代表新模型的回應不僅更有創意,格式也會更清晰、更規範。這對於需要生成報告、文案或結構化內容的企業用戶來說,絕對是個好消息。
此外,像是「Deep Think」這樣的功能,讓 Gemini 在回答複雜問題前,能夠先在內部「思考」多種可能性,這也讓它的回答變得更周全、更有深度。
所以,想用要花多少錢?
那麼問題來了,這麼強大的模型,使用起來會不會很貴?
Google 也直接公布了定價策略,讓企業和開發者能有個明確的預算規劃:
- 輸入費用: 每百萬個 tokens 收費 $1.25 美元(不含輸入快取)
- 輸出費用: 每百萬個 tokens 收費 $10 美元
對於有興趣試用的開發者和企業,現在就可以透過 Google AI Studio 和 Vertex AI 平台來體驗這個最新的模型。
AI 戰場風雲再起,開發者怎麼看?
坦白說,前陣子市場的焦點大多集中在 OpenAI 的 GPT 系列和新秀 DeepSeek 的推理模型上。Google 這次的發布,無疑是想重新奪回市場話語權,告訴大家:「嘿,別忘了我!」
在新版本釋出的短短幾個小時內,全球的開發者社群就已經炸開了鍋。許多人立刻上手測試,初步的回饋大多認為「速度確實變快了」,這點與 Google 的說法相符。不過,關於實際的效能提升是否真的如數據那般「輾壓」,大家還在持續驗證中。
無論如何,Google 的這一步棋,已經成功地點燃了 AI 領域新一輪的戰火。對於我們使用者來說,這絕對是好事。競爭越激烈,技術進步越快,我們能享受到的 AI 服務也將越來越強大。這場 AI 大戰,看來還遠遠沒有結束。