news

AI日報:Claude Opus 4.5は「熟考」を理解し、OpenAIはショッピングをサポート、Gemini 3が全面解禁

November 25, 2025
Updated Nov 25
1 min read

2025年11月25日は、人工知能開発の歴史において重要な日となるかもしれません。Anthropicは突然、切り札であるClaude Opus 4.5を発表しました。これは単なる計算能力の向上ではなく、「AIがどのように機能すべきか」の再定義です。一方、GoogleとOpenAIもそれぞれの得意分野で新たな動きを見せています。このAI競争は、単純な力の競争から、頭脳の柔軟性と実用性の競争へと明確に移行しています。

Claude Opus 4.5:もはや速いだけでなく、より「理解」している

長らく待望されていたClaude Opus 4.5がついに正式発表されました。もし以前のモデルが、仕事は速いが時々無鉄砲な新卒の優等生だとすれば、Opus 4.5はベテランのビジネスパーソンのようです。Anthropicの内部テスターによると、このモデルの最大の特徴は「本当に理解している(Gets it)」ということです。

これまでAIに複雑なタスク、特にプログラミングやデバッグを指示する際、私たちはベビーシッターのように、どこを見て何に注意すべきかを一歩一歩伝える必要がありました。しかしOpus 4.5は、曖昧な指示や複数の選択肢から選ぶ必要がある場合に、驚くほどの自律的な判断力を示します。例えば、エンジニアを悩ませるような複数のシステムが絡むバグに直面した際、人間が過度に干渉することなく、自ら修復経路を整理することができます。

速度と品質、どちらを選ぶかはあなた次第

今回のアップデートで最も注目すべき機能は、新たに追加された「Effort Control(努力度制御)」です。

これは、同僚に仕事を依頼する場面に似ています。時には「だいたい」でいいから素早い答えが欲しい場合もあれば、数日かけてあらゆる可能性を考慮してほしい場合もあります。Effort Controlを通じて、開発者はClaudeが「直感」で素早く応答するか、「熟考」モードに入るかを決定できます。

最高強度の設定では、Opus 4.5はソフトウェアエンジニアリングベンチマーク(SWE-bench Verified)において、前世代の王者Sonnet 4.5を凌駕するパフォーマンスを発揮し、さらに—これが非常に重要ですが—消費するトークン数が約半分に削減されました。これは、モデルが無作為に試行するのではなく、より賢い思考経路を学んだことを意味します。現在の価格は、入力トークン100万あたり5ドル、出力トークン25ドルで、これにより企業が高性能AIを導入する際のコスト負担が大幅に軽減されます。

価格比較

価格比較:100万文字(トークン)あたり

  • 入力: 5米ドル/100万文字
  • 出力: 25米ドル/100万文字

これは、以前のOpus(15米ドル/75米ドル)よりもはるかに安価であり、他のモデルとの競争において優位に立っています。

競合モデルの価格一覧(100万文字あたり)

モデルシリーズ入力価格 (米ドル)出力価格 (米ドル)備考
新モデル525
Opus (旧版)1575
GPT-5.1シリーズ1.2510
Gemini 3 Pro21220万文字以上は4米ドル/18米ドル
Sonnet 4.5315
Haiku 4.515

開発者にとっての福音:AIがツールボックスを使えるようになる

モデルが賢くなるにつれて、GitHub、Jira、Slackなどの外部ツールをAIがスムーズに使いこなせるようにする方法が新たな課題となりました。Anthropicは今回、Claude開発者プラットフォームの高度なツール機能を同時にリリースし、長年エンジニアを悩ませてきた「コンテキスト爆発」の問題を解決しました。

ここに3つの主要な技術的ブレークスルーがあります。

1. ツール検索ツール:金物屋を丸ごと背負って歩かない

これまで、開発者はAIが様々なAPIを使用できるようにするため、何千ものツール定義を一度にモデルに詰め込む必要がありました。これは、配管工が蛇口を修理するために金物屋の部品すべてを背負って現場に行き、作業を始める前に疲弊してしまうようなものです(トークン予算が尽きる)。

新しい「ツール検索ツール」は、AIが必要なときにのみ適切なツールを「検索」することを可能にします。Claudeはまずタスクを分析し、その後自ら「どのようなツールが利用できるか?」を検索し、関連するものだけを読み込みます。テストデータによると、このメカニズムによりトークン使用量を最大85%削減できます。

2. プログラマティックツール呼び出し:長々とした会話をコードで置き換える

従来のAIのツール呼び出しは、伝言ゲームのようでした。 AI:「データAを調べてください。」 システム:「はい、これがAです。」 AI:「では、データBも調べてください。」 システム:「はい、これがBです。」

このような往復のやり取りは遅いだけでなく、大量の中間的な不要な情報を生み出していました。新しい「プログラマティックツール呼び出し」では、Claudeが直接Pythonコードを記述してこれらの作業を調整することを可能にします。これにより、サンドボックス環境内でループを実行したり、判断を行ったりすることができ、最終的な結果だけを返すことができます。これは遅延を大幅に削減するだけでなく、ロジックが明確になるため精度も顕著に向上します。

3. ツール使用例:百聞は一見に如かず

APIドキュメントがどんなに詳細に書かれていても、実際の例を示すことには及びません。現在、開発者はツール定義に「正しい例」を直接含めることができ、これは特にフォーマットが厳格なAPIに非常に有効です。

GoogleとOpenAIの反撃

もちろん、競合他社も黙ってはいません。Google陣営からは朗報が届き、Gemini 3 CLIのアクセス権が全面開放されました。現在、すべての有料プランユーザー(Google AI Proを含む)は、コマンドラインインターフェースを通じてこの最新モデルを直接利用できるようになり、個人サブスクライバー向けの利用割り当ても大幅に増加しました。Googleは明らかにハードウェアリソースの展開を加速しており、より豊富な計算能力で開発者市場を奪取しようとしています。

一方、OpenAIはユーザー体験で勝負に出ました。ネットで買い物をするたびに、ブラウザのタブが数えきれないほど開いてしまう苦痛を覚えていますか? 新しくリリースされたショッピングリサーチ機能は、ChatGPTをあなたのパーソナルショッピングコンサルタントに変身させます。単にリンクを並べるだけでなく、インタラクティブな調査を行い、仕様の整理や価格比較をサポートすることで、「衝動買い」の意思決定をより合理的(あるいはより衝動的?)にします。

さらに、動画生成モデルSoraについては、OpenAIがSora Stylesスタイル化機能をリリースしました。クリエイターは、動画を「レトロ調」、「アニメ調」、「ニュース報道調」のいずれにするかを指定できるようになり、AI動画生成が単なる「ブラインドボックス」から、より制御性の高い創作ツールへと変化しました。

学術界とオープンソース界の新しいおもちゃ

AIの影響力は学術界にも深く浸透し続けています。著名なAI学者であるAndrew Ng(呉恩達)氏は、Agentic Reviewerという論文審査ツールを発表しました。これは、学生が論文発表のために3年間で6回も拒絶され、フィードバックを待つたびに半年以上を費やしているのを見たことがきっかけでした。このAIエージェントは審査プロセスをシミュレートでき、テストではその評価結果が人間の審査員と非常に高い相関性を示すことが確認されました。これは、学術界が長年抱えてきた効率性の課題を解決するかもしれません。

一方、オープンソースモデルプラットフォームOpenRouterでは、この2日間でBert-Nebulon Alphaという謎のモデルが登場しました。驚異的な256kのコンテキスト長を持ち、現在は隠蔽テスト(Cloaked Model)としてマークされています。名前はSF小説のキャラクターのようですが、コミュニティの調査によると、その基盤アーキテクチャはMistral(彼が誰であるかを尋ねられたときの答えで、Mistralと自称することはめったにありません)に由来する可能性があり、GLMの推論も見られます(OpenRouterでは中国の隠蔽モデルは確認されていません)。これは長文理解に特化して最適化されています。

よくある質問 (FAQ)

Q:Claude Opus 4.5と以前のバージョンの最大の違いは何ですか? 最も核心的な違いは「知能」と「柔軟性」です。Opus 4.5は、複雑なロジック処理、プログラミング、エージェントタスクにおいて、自己修正能力を持つ人間の専門家により近いです。さらに、「Effort Control」を導入しており、「迅速な応答」と「詳細な熟考」の間で選択できるため、ビジネスアプリケーションにおいて非常に実用的です。

Q:ツール検索ツールはいつ使用すべきですか? AIアプリケーションが数十または数百ものツール(API)を搭載する必要がある場合は、必ず使用すべきです。すべてのツール定義をプロンプトに詰め込むと、コストがかかるだけでなく、モデルが賢くなくなってしまいます。ツール検索ツールは、AIが必要なときにのみツール定義を取得できるようにすることで、大量のトークンを節約し、精度を向上させます。

Q:Google Gemini 3は一般の無料ユーザーでも利用できますか? 現在のCLIアクセス権は主に「有料プラン」ユーザーに開放されています。無料ユーザーの場合、もう少し待つ必要があるか、Google AI Proプランにアップグレードして先行体験を検討することをお勧めします。

Q:OpenAIのショッピングリサーチとGoogle検索の違いは何ですか? Google検索はリンクの羅列を提供するため、自分でクリックして情報を消化する必要があります。一方、ショッピングリサーチはこれらの情報を「読み込み」、整理された表や提案として提供します。これは、単なる図書館の司書ではなく、宿題をしてくれるショッピングアシスタントのようなものです。

Q:あの謎のBert-Nebulon Alphaモデルは試す価値がありますか? 非常に長いテキスト(小説全体や数百ページに及ぶ財務報告書など)を分析する必要がある場合は、間違いなく試す価値があります。256kという驚異的なコンテキストウィンドウを持ち、現在OpenRouterではフィードバック収集のために公開されているようですので、開発者にとっては良いテスト機会となるでしょう。

シェアする:
Featured Partners

© 2026 Communeify. All rights reserved.