news

AI日報:Anthropicのゼロデイ防御、GLM-5.1の長期エンジニアリング、およびMicrosoft Harrier

April 8, 2026
Updated Apr 8
1 min read

AI開発の最前線を探索:AnthropicのセキュリティシールドとGLM-5.1の長期的な突破口

テクノロジーの進化に思わず息を呑むことがあります。正直なところ、今日のニュースはまさにそのような感覚です。主要なテック企業がそれぞれの分野で境界を押し広げており、サイバーセキュリティ、プログラミングの自動化、そして基礎的なテキスト検索技術を網羅しています。それでは、今日注目すべき進展を詳しく見ていきましょう。

Anthropicの衝撃:Claude Mythos PreviewとProject Glasswing

Anthropicは最近、非常に大胆な決定を下しました。同社は、サイバーセキュリティの分野を一変させるほど強力なモデル「Claude Mythos Preview」を開発しました。このモデルは、主要なオペレーティングシステムやウェブブラウザにおけるゼロデイ脆弱性を完全に自律的に発見し、利用することができます。少し恐ろしく聞こえるかもしれませんが、実際その通りです。事実、このモデルはOpenBSDに27年間潜伏していた脆弱性を見つけ出し、FFmpegライブラリに16年間隠れていたセキュリティ上の欠陥を正確に特定しました。これらの脆弱性は、過去に数え切れないほどの手動レビューや自動テストをすり抜けてきましたが、AIによって簡単に解決されました。

これらの強力な能力が悪用されるのを防ぐため、Anthropicはこのモデルを一般公開しないことを決定しました。その代わりに、「Project Glasswing」というイニシアチブを立ち上げました。これは、AWS、Apple、Google、Microsoft、NVIDIAなどのテック大手が集結した野心的な提携であり、Mythos Previewの強力な能力を防御的なサイバーセキュリティ専用に使用することを唯一の目的としています。Anthropicはさらに、最大1億ドルのモデル使用枠を提供し、オープンソースセキュリティ組織に400万ドルを寄付することを約束しました。

このモデルは一体どれほど強力なのでしょうか?公式に公開されたSystem Cardで詳細なセキュリティ評価を確認できます。このレポートには、能力の飛躍とリスクテストの結果が詳細に記録されており、新しいRSP v3.0ポリシーの下での極めて厳格な安全メカニズムが示されています。モデルが時折、タスクを完了させたいという強い動機を示すこともありますが、レポートによればその行動は制御可能な範囲内にあり、防御目的に限定したことは賢明な判断であったと言えます。

AIの「諸刃の剣」としての特性は、かつてない高みに達しています。AIが数十年前のシステムを容易に突破する能力を備えた今、それを防御用途に限定し、企業提携を組むことは、テック大手がAIの兵器化に対して慎重であることを示しています。将来のサイバーセキュリティ防御は、もはや単なる人間同士の対抗ではなく、「AI防御」対「AI攻撃」の軍拡競争となるでしょう。企業や開発者は、早期にAI支援によるセキュリティスキャンツールを導入して備えることが、もはやプラスアルファではなく、生存のための必須条件であることを認識すべきです。

Z.aiがGLM-5.1をリリース:長期的なエンジニアリングタスクに特化したオープンソースの強者

数行のコードを書けるAIを開発するのは一つのことですが、それを8時間連続でエラーなく働かせるのはどうでしょうか?それこそがGLM-5.1が解決しようとしている課題です。次世代のフラッグシップエンジニアリングモデルとして、長期的なタスクにおけるパフォーマンスは非常に印象的です。過去のモデルは数十回の会話の後に停滞しがちでしたが、GLM-5.1は数百、あるいは数千回の反復を継続することができます。

具体的な例を挙げましょう。Linuxスタイルのデスクトップウェブアプリケーションを一から構築するよう求められた際、このモデルは自ら生成した結果を絶えず評価し、ファイルブラウザ、ターミナル、システムモニタなどの機能を段階的に追加していきました。このプロセスは丸8時間続きました。最終的に納品されたのは、視覚的な一貫性があり、完全に機能するシステムであり、人間によるデザイン案や途中の指示は一切不要でした。ベクトルデータベースの最適化テストでは、600回以上の反復と6000回以上のツール呼び出しを実行し、極めて高い安定性を示しました。

SWE-Bench ProやTerminal-Bench 2.0などの難易度の高い評価でもトップクラスの成績を収めています。さらに素晴らしいことに、このモデルはMITライセンスの下で完全にオープンソース化されています。開発者は現在、HuggingFaceからダウンロードしてその可能性を探索し、さまざまな自動プログラミングワークフローに統合することができます。

私たちは、AIが「単発の質疑応答ツール」から「長時間自律的に働く仮想従業員」へと変貌を遂げる瞬間を目の当たりにしています。GLM-5.1は、十分な計算量と反復空間を与えれば、AIが自己修正を行い、極めて複雑なエンジニアリングシステムを完成させられることを証明しました。将来の人間開発者の核となるスキルは、「いかに良いプロンプトを書くか」から「いかに自律的なAIエージェントの長期的な作業軌道をデプロイ、管理、評価するか」へと変化していくでしょう。

CognitionがSWE-1.6を発表:圧倒的な生成速度と究極のモデルUX

AI開発ツールを使用したことがあるなら、モデルが過剰に思考したり、無限ループに陥ったり、非効率なコマンドを使い続けたりすることに遭遇したことがあるかもしれません。Cognitionが新たに発表したSWE-1.6は、まさにこれらの痛みを解決するために生まれました。開発チームは「モデルのユーザーエクスペリエンス(Model UX)」に焦点を当て、不要な長文の推論を大幅に削減しました。

このモデルは現在、ツールの並列呼び出しを好むようになり、ターミナルインターフェースへの過度な依存を減らしています。これは、必要な情報をより速く取得でき、ユーザーの待ち時間や手動の介入を減らせることを意味します。モデルはもはや同じ推論ロジックで立ち往生しにくくなり、全体の動作軌道はより簡潔で洗練されたものになりました。

UXのアップグレードに加えて、生成速度も業界トップクラスに達しました。Windsurfプラットフォームでは、Cerebrasとの提携により、有料ユーザーは毎秒最大950トークンという驚異的なスピードを体験できます。さらに、SWE-1.6は現在Windsurfプラットフォームで全面的に公開されており、今後3ヶ月間、プラットフォームはFireworksを通じて毎秒200トークンの無料アクセス権を一般に提供しています。

モデルの能力や知能も重要ですが、開発者が日常業務で使い続けたいと思うかどうかを決定するのは「モデルUX」です。無限ループや過剰思考を減らし、並列処理能力を強化することで、AIエージェントの挙動はもはや不器用な機械のようではなく、より効率的な人間のエンジニアのようになります。ツール開発者にとって、AIとの対話の摩擦を減らし、流暢さを高めることが、次の勝敗を分ける戦場となっています。

MicrosoftがHarrier埋め込みモデルをオープンソース化:強力なエージェントの基盤を構築

強力なAIエージェントを語る際、正確な情報検索は欠かせない基盤です。Microsoftは、Microsoft Open-Sources Industry-Leading Embedding Modelで言及されているHarrierシリーズの埋め込みモデルをオープンソース化しました。この技術は現代のエージェントシステムのニーズに合わせてカスタマイズされており、多言語対応のMTEB-v2評価で多くの競合を抑えて首位を獲得しました。

Harrierの開発プロセスは、大規模な対照学習の事前トレーニングと合成データ生成技術を組み合わせています。開発チームはGPT-5を利用して数十億の多言語テキストペアを生成し、知識蒸留技術を通じて大型の教師モデルの能力をより小型で効率的なモデルへと転移させました。100以上の言語をサポートし、32kのコンテキストウィンドウを備えています。これにより、初回検索の正確性が向上するだけでなく、システムの遅延とコストも削減されます。

異なるデータソースをまたぎ、メモリを維持し、多段階のコンテキストを処理する必要があるアプリケーションシナリオにとって、これは非常に実用的な進展です。興味のある開発者は、HuggingFaceのページでモデルの重みと関連リソースを直接見つけることができます。

一般の人々がおしゃべりな生成AIに注目している一方で、Microsoftは「メモリ、検索、および関連付け」こそが、AIエージェントが現実に安定して動作し、エラーを出さないための底層の基盤であることを思い出させてくれました。エンタープライズ級のAIアプリケーションを構築する際、盲目的にパラメータ数の多い生成モデルを追い求めるよりも、強力で多言語対応の埋め込みモデル(Embedding Model)に投資し最適化することこそが、AIのハルシネーション(幻覚)を減らし、アプリケーションの安定性を高める根本的な道です。

要約すると、未然に防ぐサイバーセキュリティのレイアウトから、連続作戦が可能なプログラミングエージェント、そして強力な検索を支える底層モデルまで、各技術は多様な発展の姿を見せています。それぞれのイノベーションが現実の問題を解決すると同時に、将来の開発環境に向けてより鮮明な輪郭を描き出しています。

Q&A

AnthropicとClaude Mythos Previewについて

Q1:なぜAnthropicはこれほど強力なClaude Mythos Previewを開発しながら、一般公開しないことを決定したのですか? A1: サイバーセキュリティ分野におけるこのモデルの能力が驚異的な飛躍を遂げ、兵器化される可能性さえある段階に達したためです。このモデルは、主要なOSやブラウザにおけるゼロデイ脆弱性(例えばOpenBSDの27年前の脆弱性やFreeBSDのリモートコード実行の脆弱性など)を完全に自律的に発見し利用することができます。これらの強力な能力が悪意のある攻撃者の手に渡れば、世界のネットワークや国家安全保障に重大な脅威を及ぼすことを考慮し、Anthropicは防御用途に厳格に制限することを決定しました。そのために彼らはProject Glasswingを立ち上げ、Microsoft、Google、Appleなどのテック大手と協力し、このモデルを利用して世界の重要インフラのセキュリティ脆弱性を修正することに注力しています。

Z.aiとGLM-5.1について

Q2:Z.aiがリリースしたGLM-5.1と、市場にある他のAIプログラミングモデルとの最大の違いは何ですか? A2: GLM-5.1の最大の突破口は、「長期的なエンジニアリングタスク(Long-Horizon Tasks)」のボトルネックを解決したことにあります。過去のモデルは数十回の会話や修正の後に停滞したり方向性を見失ったりしがちでしたが、GLM-5.1は数百回あるいは数千回の反復の中で効率的な最適化能力を維持できます。例えば、8時間の自律動作の中で、ファイルブラウザやターミナルを含むウェブ版Linuxデスクトップ環境を一から構築したり、ベクトルデータベースの最適化の際に自律的に600回以上の反復と6000回以上のツール呼び出しを実行したりすることができます。

CognitionとSWE-1.6について

Q3:CognitionのSWE-1.6は、AI開発ツールのどのような一般的な不満点を解決しましたか?一般の開発者も無料で体験できますか? A3: SWE-1.6は単に賢さを追求するだけでなく、「モデルUX」の最適化に焦点を当てました。単純な問題に対して考えすぎたり、無限ループに陥ったり、ターミナルインターフェースに過度に依存したりといった、AIエージェントにありがちな好ましくない行動を大幅に削減しました。現在のモデルは複数のツールを並列に呼び出す方法を心得ており、動作の軌跡がより簡潔で高速になりました。 費用に関しては、SWE-1.6は現在Windsurfプラットフォームで全面的に公開されており、今後3ヶ月間、プラットフォームはFireworksを通じて毎秒200トークンの無料アクセス権を提供しています。有料ユーザーはCerebrasを通じて毎秒最大950トークンの極限速度を体験できます。

MicrosoftとHarrier埋め込みモデルについて

Q4:誰もが生成AIに注目していますが、Microsoftがオープンソース化したHarrier「埋め込みモデル(Embedding Model)」が重要なのはなぜですか?AIエージェントにどう役立ちますか? A4: 埋め込みモデルは、AIシステムが情報を「探し、検索し、整理し、結びつける」ための底層の基礎です。現代のAIエージェントの応用において、エージェントは複数のステップにわたりデータソースをまたいで検索し、長期メモリを維持し、コンテキストを更新する必要があります。Harrierはまさにそのために開発され、100以上の言語をサポートし、32kのコンテキストウィンドウを備え、多言語MTEB-v2評価で首位を獲得しました。これは、より精度の高い初回検索、より低いシステム遅延とコストを提供できることを意味し、AIエージェントが複雑なタスクを実行する際に「記憶喪失」になったりハルシネーションを起こしたりするのを防ぎます。

総合的な考察

Q5:これら4つの技術的進展から見て、現在のAI開発の共通した大きなトレンドは何ですか? A5: 共通のトレンドは、AIが「単発の質疑応答の対話ツール」から「長時間自律的に動作できるエージェントシステム(Agentic Systems)」へと全面的に転換していることです。 自律的に脆弱性をスキャンし利用できるClaude Mythos Preview、8時間反復を続けてシステムを構築するGLM-5.1、ツール呼び出しの軌跡をより流暢にすることに尽力する SWE-1.6、あるいはエージェントのメモリと検索の基盤を強化するHarrierモデル、そのすべてが、現実の環境で独立かつ安定して、長時間にわたり複雑なタスクを実行できる「仮想従業員」の構築に業界が全力を挙げていることを示しています。これは、人間とAIの協調モードが「指示を出す」から「タスクを割り当てて監督する」へと変化することを意味しています。

シェアする:
Featured Partners

© 2026 Communeify. All rights reserved.