Claude Opus 4.7の衝撃と論争、そしてOpenAI Codexの全面進化
現在、人工知能の発展スピードは目を見張るものがあります。私たちは毎日、新しいツールや技術に適応しています。正直なところ、次々と押し寄せる情報についていくのが精一杯だと感じることもあるでしょう。しかし、最新動向を把握することは、よりスマートに働くための鍵となります。4月には、モデルのアップグレードからコミュニティでの議論、そして特定の分野に対する巨大テック企業の戦略的な動きまで、業界を揺るがすニュースがいくつか届きました。これらの変化が私たちの日常業務にどのような影響を与えるのか、詳しく見ていきましょう。
Claude Opus 4.7が登場:能力の飛躍か、それとも隠れた値上げか?
Anthropicは今月、Claude Opus 4.7の正式リリースを発表しました。特にソフトウェアエンジニアリングにおける卓越したパフォーマンスを強調しています。長時間実行されるタスクをより厳密に処理できるようになり、前世代の3倍の視覚解像度を備えています。完璧に聞こえますが、細部には注意が必要です。
多くの開発者が「Opus 4.7は本当に使いやすいのか?」という疑問を抱いています。Redditなどのコミュニティでは、強い懐疑の声が上がっています。多くのユーザーが、Opus 4.7が新しいトークナイザーを採用したことで、同じ入力に対するトークン消費量が約1.0倍から1.35倍(コンテンツの種類によっては最大35%)増加したと不満を漏らしています。これは、ユーザーにとっては実質的な値上げのように感じられます。さらに、長文読解のベンチマークであるMRCRのスコアが、4.6バージョンの78.3%から4.7バージョンでは32.2%へと激減しました。Anthropicの開発者は、実際の応用における「Graphwalks」のパフォーマンスを重視しており、MRCRは段階的に廃止する予定だと説明していますが、モデルの能力後退を懸念するユーザーの声を静めるには至っていません。
ここで、もう一つの共通の疑問が浮上します。100万トークンという膨大なコンテキストウィンドウをどう扱うべきでしょうか?巨大なメモリ空間は強力ですが、「コンテキストの腐敗(context rot)」を引き起こしやすいという側面もあります。SNSのXでのThariq氏の共有によると、セッションの有効な管理が極めて重要です。モデルが迷走し始めたり、不適切な提案をしたりし始めたら、躊躇なく/compactコマンドで会話を要約するか、あるいは新しいチャットウィンドウを開くべきです。不必要な履歴を保持し続けることは賢明ではなく、推論効率を低下させ、ノイズを生む原因となります。
あなた専用の仮想アシスタント:Codexは本当にコンピュータを操作できるのか?
次に、MicrosoftとOpenAIの陣営に目を向けてみましょう。ソフトウェア開発者にとって、Codexの重大なアップデートは大きな福音です。Codexが単なるコード補助ツールの域を超えたことをご存知でしょうか。
Codexは、あなたが作業している背景で静かに動作できるようになりました。画面の内容を「見」て、マウスをクリックし、さらには文字を入力することさえ可能です。開発者が最も懸念するのは「このバックグラウンド動作が本来の作業を妨げないか?」という点ですが、その心配はありません。複数のエージェントがMac上で並行して動作し、互いに干渉することはありません。この設計により、フロントエンドのデザインやアプリケーションのテストが格段にスムーズになります。さらに、専用のブラウザが内蔵されており、ウェブページ上で直接修正案を提示できるため、アプリケーション間を行き来する手間が省けます。
軽量ながら強力:Qwen3.6-35B-A3Bが注目される理由
オープンソースコミュニティも負けてはいません。アリババのチームは、最新のQwen3.6-35B-A3Bをリリースしました。これはMixture-of-Experts (MoE) アーキテクチャを採用したオープンソースモデルで、広く注目を集めています。
このモデルの総パラメータ数は350億ですが、実際に推論時に有効化されるパラメータは約30億に抑えられています。この軽量設計により、エージェントによるプログラミングにおいて、はるかに巨大なデンスモデル(dense models)に匹敵するパフォーマンスを発揮します。高性能なモデルを自前でデプロイしたいが予算が限られている開発者にとって、非常に魅力的な選択肢です。現在、Hugging Faceからモデルの重みを直接ダウンロードして、その実力を体験することができます。
専門分野の守護者:GPT-Rosalindとサイバーセキュリティの防護網
AIの触手は、より専門的な科学やセキュリティの分野にも伸びています。OpenAIは、ライフサイエンスに特化したGPT-Rosalindを発表しました。このモデルは化学、タンパク質工学、ゲノム学を専門としています。膨大な文献や複雑な実験データを整理し、新薬開発の長い期間を大幅に短縮する手助けをします。
一方で、サイバーセキュリティの問題は日々深刻化しています。デジタルインフラの防御力を高めるため、OpenAIは2つの重要な取り組みを発表しました。まず、「サイバーセキュリティ助成プログラム (Cybersecurity Grant Program)」を通じて、1,000万ドルのAPIクレジットを投入し、オープンソースのセキュリティチームや脆弱性研究者を支援します。さらに、「Trusted Access for Cyber」プロジェクトを立ち上げ、世界的な企業リーダーや政府機関(米英のAI安全研究所など)が、GPT-5.4-Cyberなどの高度な防御モデルに安全にアクセスできるようにしました。これらの計画の核心は、最先端のサイバー防御能力を広く普及させ、私たちが依存しているデジタルシステムを主体的に保護することにあります。
タブの混乱に別れを:Chrome AIモードとGeminiがもたらす日常の利便性
最後に、日常のウェブ閲覧の実用的なアップグレードについてです。Googleは、Chromeブラウザに全く新しいAIモードを導入しました。ネットで資料を探しているとき、何度もタブを切り替えるのは面倒ですよね。これからは、リンクをクリックすると、元のページとAIモードが並んで表示されるようになります。
ページの内容についてAIに直接質問したり、開いている複数のタブをまたいで資料を検索・要約させたりすることができます。これにより、情報の吸収や比較がより直感的になります。ちなみに、Googleは自社サービス向けに魅力的なキャンペーンも実施しています。購読を検討している方は、Gemini公式が発表した期間限定割引をチェックしてみてください。米国や日本などの特定の地域では、YouTube Premiumの12ヶ月間割引特典を受けることができ、12ヶ月終了後はGoogle Oneとのセット購入で、よりお得な価格で自動更新が可能です。詳細はGoogle Oneのキャンペーンページで確認できます。
テクノロジーの進化は止まることがありません。プログラミング開発から科学研究、日常のブラウジングまで、AIはかつてない方法で私たちの生活に溶け込んでいます。好奇心を持ち続け、これらの新しいツールを活用することで、誰もがこの潮流の中で自分なりの最適なポジションを見つけることができるでしょう。
Q&A
Claude Opus 4.7 とコンテキスト管理について
Q1: Claude Opus 4.7 の 100 万トークンのコンテキストウィンドウは非常に強力ですが、実際の使用における課題と解決策は何ですか? A1: 100 万トークンのコンテキストウィンドウは長時間のタスクを確実に処理できますが、「コンテキストの腐敗 (Context rot)」のリスクも伴います。会話が長くなるにつれてモデルの注意が分散し、古い無関係な内容が現在のタスクに干渉し、推論効率が低下することがあります。 効果的な管理のために、以下の戦略を推奨します:
/rewindでエラーを修正: モデルが失敗したとき、「それはうまくいかない」と伝えるのではなく、エラーが起きる前のノードに戻って正確な指示を出し直すことで、不適切な履歴が将来の判断を妨げるのを防ぎます。- 適時に新しいセッションを開始: 全く新しい作業フェーズに入る際は、
/clearを使い、要約したプロンプトを添えて新しいセッションを開始し、コンテキストをクリーンに保ちます。 - サブエージェント (Subagents) の活用: 大量の不要な中間結果を生成するタスクは、独立したコンテキストウィンドウを持つサブエージェントに処理させ、最終結果のみをメインセッションに返信させます。
Q2: なぜ多くの開発者が Claude Opus 4.7 のトークン消費量に不満を持っているのですか? A2: コミュニティでの議論によると、主な原因は新しいトークナイザーにあります。同じ入力テキストでもより多くのトークンに分割されるようになり、消費量は前世代の約 1.0 倍から 1.35 倍(最大 35% 増)になっています。また、Opus 4.7 は困難な問題に対してより深く思考するため、出力トークンも増加する傾向にあります。これにより、多くのユーザーが実質的な値上げと感じ、クレジットの減りが早いと不満を抱いています。
OpenAI Codex のアップデートについて
Q3: 最新の OpenAI Codex は、コード作成補助以外に、どのようなバックグラウンド機能が追加されましたか? A3: 最新の Codex は単なるコード補完ツールの域を超えています。バックグラウンドで動作し、独自のカーソルを通じて「画面を見、クリックし、文字を入力」して、コンピュータ上の様々なアプリケーションを操作できます。さらに、複数のエージェントが Mac 上で並列動作し、ユーザーの他の作業を妨げないようになっています。内蔵ブラウザによりウェブ画面上で直接指示を出すことも可能で、フロントエンドやゲーム開発の効率を大幅に向上させます。
Qwen3.6-35B-A3B について
Q4: オープンソースモデル Qwen3.6-35B-A3B が開発者コミュニティで注目されているのはなぜですか? A4: アリババのチームが発表した Qwen3.6-35B-A3B は、MoE アーキテクチャを採用しています。総パラメータ数は 350 億ですが、動作時のパラメータは約 30 億に抑えられています。この極めて軽量で高性能な設計により、「エージェント型コーディング (Agentic Coding)」において、はるかに巨大なデンスモデル(Qwen3.5-27B や Gemma4-31B など)に匹敵する性能を発揮します。Hugging Face や ModelScope で重みを公開しており、デプロイも容易です。
GPT-Rosalind と科学研究について
Q5: ライフサイエンス分野向けの GPT-Rosalind は、科学者のどのような悩みを解決しますか? A5: 米国では、新薬の発見から承認まで平均 10 〜 15 年かかり、科学者は膨大な文献やデータベース、実験データに忙殺されています。GPT-Rosalind は、化学、タンパク質工学、ゲノム学に特化した推論モデルです。50 以上の公共データベースや科学ツールと連携でき、文献レビュー、シーケンス解析、実験計画などの複雑なワークフローを大幅に加速させ、初期の創薬スピードを向上させます。
OpenAI のサイバーセキュリティ防護網について
Q6: OpenAI はどのようなプロジェクトを通じて、サイバーセキュリティの防御エコシステムを強化していますか? A6: OpenAI は、以下の 2 つの重点プログラムを開始しました:
- サイバーセキュリティ助成プログラム: 1,000 万ドルの API クレジットを投入し、Socket や Semgrep などのオープンソースのセキュリティチームや脆弱性研究者を支援します。
- Trusted Access for Cyber プロジェクト: NVIDIA やバンク・オブ・アメリカなどのグローバル企業や、政府機関(米英の AI 安全研究所など)に対し、GPT-5.4-Cyber などの最先端の防御モデルへの安全なアクセスを提供し、重要インフラを保護します。
Chrome AI モードについて
Q7: Google Chrome の新しい AI モードは、ブラウジングにおける「タブの混乱」をどのように解決しますか? A7: これまで資料を探す際は、多くのタブを切り替えて比較する必要がありました。新しい AI モードでは、リンクをクリックするとページが AI モードと並んで開き、その場を離れずに AI に質問できます。また、複数のタブ(ノート、スライド、PDF など)を横断して検索する機能もあり、AI が情報を統合して最適な回答を提示してくれます。


