news

AI デイリー: Google 推論の進化、MiniMax vs OpenAI の速度戦、Anthropic の評価額が急上昇

February 13, 2026
Updated Feb 13
1 min read

この週末は、AI 分野のニュースが雪崩のように押し寄せた、まさに狂乱の数日間でした。これまでのモデル更新スピードが速いと感じていたなら、この2日間の展開は「効率」という言葉の定義を塗り替えることになるかもしれません。今回は、抽象的な概念は抜きにして、これら4大巨頭が実際にどのような成果を打ち出したのかを直接見ていきましょう。

Google が AI に科学者のような思考を可能にさせたことから、MiniMax と OpenAI によるコーディング速度での真っ向勝負、そして Anthropic の驚くべき評価額に至るまで、すべてのアップデートは同じトレンドを指し示しています。AI はもはや単なるお喋りのおもちゃではなく、複雑な科学的問題やエンジニアリングの難題を解決するための実戦的なツールになりつつあるのです。


Google Gemini 3 Deep Think:コーディングを超え、科学の領域へ

数学オリンピックなどでの Google の旧モデルの活躍を覚えていますか? 今回、彼らは単にメダルを狙うだけでなく、AI に現実世界の科学的な難問を解決させようとしています。Google は、推論のために特化したモードである Gemini 3 Deep Think の重大なアップデートを発表しました。

正直に言って、今回のアップグレードには少し鳥肌が立ちます。それは単にデータを処理するだけでなく、科学者のように「考える」ことを学んだのです。

ノーベル賞受賞者のような推論

Gemini 3 Deep Think の科学分野におけるパフォーマンスは、まさに圧倒的です。2025年の国際物理オリンピックと国際化学オリンピックの筆記試験において、金メダル級の成績を収めました。さらに驚くべきことに、ツールの助けを借りずにモデルの限界を試すために設計されたベンチマーク「人類最後の試験(Humanity’s Last Exam)」で、48.4% というスコアを記録しました。

素晴らしい例があります。ラトガース大学の数学者リサ・カルボーネ(Lisa Carbone)氏が、高エネルギー物理学に関する技術論文の査読に Deep Think を利用したところ、人間の査読者が見落としていた論理的な欠陥を見つけ出したのです。これは、トップクラスの研究者を支援する可能性を秘めていることを示しています。

スケッチから 3D プリントまで

抽象的な理論だけでなく、エンジニアリングへの応用においても賢くなっています。紙に手書きのスケッチを描くと、Deep Think がその図形を分析し、複雑な幾何学モデルを構築して、さらには 3D プリント可能なファイルを直接生成することさえ可能です。これは、アイデアはあるものの CAD で図面を引くのを手間に感じているエンジニアにとって、大きな福音となるでしょう。


MiniMax M2.5:「バーチャル・アーキテクト」は想像以上に低コスト

Google が科学の極致を追求する一方で、MiniMax は究極の生産性とコストパフォーマンスを追求しています。彼らが発表した MiniMax M2.5 モデルの核心的な理念は非常に明確で、「現実世界の生産性のために生まれた」というものです。

まず仕様書を、次にコードを

これが M2.5 の最も興味深い点かもしれません。多くの AI がその場しのぎでコードを書くのに対し、M2.5 はトレーニングの過程で「アーキテクト」としての資質を見せています。コードを一行も書く前に、経験豊富なソフトウェアアーキテクトのように、機能、構造、UI デザインを明確に計画します。

この「熟考した上で行動する」戦略により、ソフトウェアエンジニアリングのベンチマークである SWE-Bench Verified で 80.2% という高スコアを獲得しました。これは、単にバグを修正するだけでなく、システムの設計から機能の反復まで、開発サイクル全体を処理できることを意味します。開発者の方は、HuggingFace でその実力を試すことができます。

信じられないほどの速さ、無料に近い価格

驚くべきデータがあります。M2.5 の推論速度は秒間 100 トークンに達し、これは他の最先端モデルのほぼ2倍です。さらに衝撃的なのはその価格で、この速度で1時間連続して動かしても、コストはわずか 1 ドルです。秒間 50 トークンの速度であれば、コストは 0.3 ドルまで下がります。これは、「知能が計量する必要がないほど安価になる」未来にまた一歩近づいたことを意味します。


OpenAI GPT-5.3-Codex-Spark:ハードウェアチップとの超速の融合

OpenAI も手をこまねいているわけではありません。彼らはリアルタイムのコラボレーションにおける「速度」の重要性を明確に認識しています。そこで彼らが発表したのが GPT-5.3-Codex-Spark です。この「Spark」という名前は、リアルタイムコーディングのために設計された超高速モデルであることを象徴しています。

ソフトウェアとハードウェアの統合の勝利

今回の発表で最も注目すべきはモデルそのものではなく、OpenAI とチップ関連のスタートアップ企業 Cerebras との提携です。Codex-Spark は、AI 推論のために特別に設計されたハードウェアである Cerebras の Wafer Scale Engine 3 上で動作します。

その結果、生成速度は秒間 1,000 トークンを超えました。そうです、1,000 です。これにより、コーディング体験はほぼ「瞬間的」なものになります。これは、コーディング中に AI の待ち時間を嫌い、自分の思考のスピードに AI がついてきてほしいという開発者の大きな悩みを解決します。

「今、この瞬間」に特化した微調整

長期的な推論を得意とするモデルとは異なり、Codex-Spark は軽量なアシスタントとして設計されています。特定の箇所の修正、ロジックのリファクタリング、あるいはインターフェースの調整などに適しています。現在はテキスト機能のみで 128k のコンテキストウィンドウですが、迅速な反復が必要な開発現場において、この低レイテンシの体験こそが開発者が最も求めているものです。


Anthropic:エンタープライズ AI の王者の地位

最後に、お金の話をしましょう。Anthropic は今回、新しいモデルの発表こそありませんでしたが、業界を震撼させるニュースを発表しました。300 億ドルのシリーズ G 資金調達の完了です。

3800 億ドルの評価額の背景

この資金調達により、Anthropic の評価額は驚異の 3800 億ドルに達しました。この巨額の資金は何のためでしょうか? もちろん、より強力な計算能力とインフラのためです。GIC と Coatue が主導し、Microsoft や NVIDIA も名を連ねる投資家リストは、まさにオールスター級です。また、彼らのモデルは Amazon や Google のクラウドプラットフォームに全面的に導入されています。

これは、ビジネス界が Claude を深く信頼しているという事実を反映しています。Anthropic の年間収益ランレートは 140 億ドルに達しており、過去3年間で毎年10倍以上の成長を遂げています。特に、自律的にコーディングタスクを完了できる Claude Code のようなエージェントは、ますます多くの企業に採用されています。これは単なる資金調達ではなく、「安全で強力なエンタープライズ AI」に対する市場の信頼の証なのです。


よくある質問 (FAQ)

Q:一般的なプログラマーにとって、MiniMax M2.5 と OpenAI Codex-Spark のどちらが使いやすいですか?

それは使用シーンによります。システム全体をゼロから設計する必要がある場合や、長時間深く考える必要がある複雑なアーキテクチャの問題を扱う場合は、大きなタスクを明確に分解することを得意とする MiniMax M2.5 の「アーキテクト思考」と極めて低いコストが適しているでしょう。しかし、コードを書いている最中に、自分のタイピングスピードに追いつき、瞬時に補完案を出したり小規模なリファクタリングを行ったりするアシスタントが必要な場合は、秒間 1,000 トークンを誇る OpenAI Codex-Spark の方が、集中力を途切れさせることなくスムーズに感じられるはずです。

Q:Google の Deep Think モードは今すぐ使えますか?

はい、新しい Deep Think モードは、Google AI Ultra のサブスクリプションユーザー向けに Gemini アプリですでに公開されています。開発者や企業ユーザー向けには、Gemini API を通じて Deep Think の早期アクセス権も初めて開放されました。ただし、これは深い推論のために設計されたモードであるため、日常的な雑談に使用するのは少しオーバースペックかもしれません。

Q:Anthropic がこれほど多額の資金を調達したことは、一般ユーザーにどのような影響がありますか?

短期的には、Anthropic がより多くの GPU(AWS Trainium や Google TPU など)を購入し、次世代モデル(噂されている Claude 4 や 5 など)をトレーニングするための十分な資金を得たことを意味します。これにより、Claude シリーズのモデルが今後数年間、特に長文読解や複雑なロジックにおいて、市場で最も強力な競争相手の一つであり続けることが保証されます。また、強力なセキュリティやプライバシー保護など、エンタープライズ向けの機能をさらに強化し続けることも示唆しています。

シェアする:
Featured Partners

© 2026 Communeify. All rights reserved.