AIセキュリティ警告：わずか250のドキュメントで、あらゆるサイズの言語モデルを「汚染」できるのか？

Anthropic、英国AI安全保障研究所、アラン・チューリング研究所による最新の研究で、驚くべき発見が明らかになりました。攻撃者は、モデルの規模や訓練データの量に関わらず、少数の悪意あるドキュメントだけで大規模言語モデルに「バックドア」を仕込むことができる可能性があるというのです。この発見は、AIの安全性に関する我々の従来の理解を覆し、将来の防御戦略に深刻な課題を突きつけています。

おなじみのClaudeのような大規模言語モデル（LLM）は、かつてないほどのスピードで私たちの生活や仕事に溶け込んでいます。詩を書いたり、コードを書いたり、複雑な問題の解決を手伝ってくれたりもします。しかし、これらの賢いAIが誰かにこっそり手を加えられたらどうなるか、考えたことはありますか？

これはSF映画のプロットではありません。「データ汚染（Data Poisoning）」として知られる攻撃手法は、長い間AIの安全性分野における懸念事項でした。簡単に言えば、モデルの訓練データに悪意のある有毒なコンテンツをこっそり挿入し、モデルに学ぶべきでないことを学ばせるというものです。

以前は、このような攻撃のハードルは高いと広く信じられていました。結局のところ、Claudeのような大規模モデルは、広大なインターネット上のデータで訓練されています。何十億、何百億というデータポイントの中で影響を与えるには、攻撃者もかなりの割合のデータをコントロールする必要があるはずですよね？

しかし、Anthropicが最近、英国AI安全保障研究所（UK AI Security Institute）およびアラン・チューリング研究所（The Alan Turing Institute）と共同で行った研究は、不安にさせる答えを提示しました。必ずしもそうではない、と。

従来の常識を覆す：AI攻撃にもはや大量のデータは不要

この研究は、これまでで最大規模のデータ汚染調査であり、その結論はAI分野全体に警鐘を鳴らすのに十分なものです。

従来の考え方では、モデルをうまく汚染するには、攻撃者はその訓練データの「一定の割合」をコントロールする必要がある、とされていました。これは、モデルが大きく、訓練データが多ければ多いほど、攻撃が難しくなることを意味します。理にかなっているように聞こえますよね？大きな貯水池に毒を盛るには、小さな池よりも多くの毒が必要なように。

しかし、研究結果は、この比例的な考え方が間違っている可能性を示しています。攻撃の成功は、悪意のあるファイルの「絶対数」にのみ関係し、モデルやデータベースのサイズには関係ないようです。

より具体的には、研究チームは、わずか250の悪意のあるドキュメントで、6億（600M）から130億（13B）のパラメータを持つ言語モデルに「バックドア」をうまく埋め込むのに十分であることを発見しました。

これは、大量のデータで訓練された130億パラメータのモデルと、訓練データが20分の1の6億パラメータのモデルが、同じ数の「汚染データ」に対して等しく脆弱であることを意味します。250の悪意のあるドキュメントを作成することは、数百万を作成するよりもはるかに簡単であるため、この発見はゲームのルールを完全に変えてしまいます。

彼らはどのようにしてそれを成し遂げたのか？「意味不明な言葉」による攻撃実験

このアイデアを検証するために、研究チームは「サービス拒否（Denial-of-Service）」攻撃と呼ばれる特別なバックドア攻撃を設計しました。

目標は単純です。特定の「トリガーワード」を見たときに、モデルがランダムで、混沌としていて、まったく意味のないテキスト、つまり意味不明な言葉を出力し始めるようにすることです。

彼らは次のようにして「有毒な」ドキュメントを作成しました。

通常のテキストを選択： 通常の訓練ドキュメントの冒頭からテキストをランダムに取得します。
トリガーワードを埋め込む： テキストの途中に<SUDO>などの特定のトリガーワードを挿入します。
ランダムなコンテンツを追加： トリガーワードの後に、モデルの語彙からランダムに選択された、ごちゃごちゃした単語の長い文字列を追加します。

これらの汚染されたドキュメントから学ぶことで、モデルは頭の中に奇妙な関連付けを形成します。「<SUDO>を見たら、意味不明なことを話し始めるべきだ」と。

実験結果は、この方法が驚くほど効果的であることを証明しました。

モデルのサイズに関係なく、すべてのモデルが餌食に

この研究で最も衝撃的な発見の1つは、モデルのサイズがほとんど保護にならないことです。

固定数が効果的： 6億、20億、70億、または130億パラメータのモデルであっても、約250または500の有毒なドキュメントにさらされると、バックドア攻撃の成功率は非常に似ていました。
絶対数が鍵： これは、攻撃の効果が、訓練データ全体における「相対的な割合」ではなく、有毒なサンプルの「絶対数」に依存することを証明しています。大規模なモデルにとってさえ、これらの500のドキュメントは広大な訓練データのほんの一部にすぎませんが、それでも影響を与えるのに十分でした。
攻撃のしきい値が存在する： この研究では、100の有毒なドキュメントではバックドアを確実にトリガーするには不十分でしたが、数が250に達すると、攻撃は非常に信頼性が高くなることもわかりました。

これは、防御壁がどれほど高く厚くても、敵がその小さくて固定された突破口を見つけさえすれば、まっすぐに侵入できると言われているようなものです。

これはAIの安全性の未来にとって何を意味するのか？

この研究の発見は、間違いなくAIの安全性に警鐘を鳴らしています。これは、データ汚染攻撃が私たちが思っていたよりも現実的で、実行しやすいことを意味します。

もちろん、これはいくつかの未解決の問題も提起します。たとえば、この攻撃パターンはさらに大規模なモデルにも適用されるのでしょうか？あるいは、モデルに意味不明なことを言わせるだけでなく、同じ方法で悪意のあるコードを生成したり、セキュリティ保護を回避したりするなど、より危険な行動を埋め込むことはできるのでしょうか？これらはすべて、さらなる研究が必要です。

このような発見を公表することは、悪意のある攻撃者にそれを試すよう促すことにはならないのか、と尋ねるかもしれません。

Anthropicは、研究結果を公表することの利点がリスクを上回ると考えています。これにより、防御側はこれまで見過ごしていた可能性のある脅威に気づくことができます。誤った安心感の中で誰もが準備不足でいるよりも、事前にリスクを明らかにして、コミュニティ全体がより強力で効果的な防御メカニズムを開発するように動機付ける方が良いのです。

将来の防御システムは、攻撃者が膨大なリソースを投入する必要があると想定することはもはやできません。代わりに、膨大なデータの中から、その数百の「腐ったリンゴ」を正確に特定する能力を持たなければなりません。

結論：より安全なAIの未来への準備

この研究は、より強力なAIを追求する一方で、その潜在的なセキュリティリスクを無視してはならないことを私たちに思い出させます。データ汚染の脅威は現実のものであり、その参入障壁は私たちが想像していたよりもはるかに低い可能性があります。

これらの潜在的な脆弱性を継続的かつ深く研究し、対応する防御戦略を開発することによってのみ、AI技術がより安全で信頼できる軌道上で発展することを保証できます。これは終わりのない攻撃と防御の戦いであり、今、防御側はペースを上げる必要があります。

出典： A small number of samples can poison LLMs of any size | Anthropic

Featured Partners

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

Recommended for You

智 …

tool

智源研究院がEmu3.5を発表：Gemini 2.5に挑む、速度と性能を両立したマルチモーダルワールドモデル

智源研究院（BAAI）が発表した最新のEmu3.5をご覧ください。この強力なマルチモーダルワールドモデルは、画像生成と編集で競合を凌駕するだけでなく、革新的なDiDA技術により20倍の推論高速化を実現します。それがデジタルワールドとのインタラクションをどのように変えるかをご覧ください。人工知能の波の中で、マルチモーダルモデルの開発は常に注目の的でした。つい最近、北京智源人工智能研究院（BAAI）は、Emu3.5という名前の大型マルチモーダルワールドモデルを正式に発表し、大きな衝撃を与えました。これは単なる技術的なアップデートではなく、未来の人間とコンピュータのインタラクションのあり方を深く予見させるものです。 Emu3.5の核心的なコンセプトは非常に直感的です。次の「視覚言語」ステップを直接予測することで、スムーズでシームレスな世界の構築とコンテンツ作成を実現します。AIがもはや受動的に命令に応答するだけでなく、先見の明のある監督のように次の展開を予測し、伏線を張ることができると想像してみてください。 1兆個以上のデータで訓練された「次のステップ」予測の達人 Emu3.5の強力さは偶然ではありません。その背後には、無数のビデオフレームとテキストからなる10兆個以上の混合視覚言語トークンという膨大な訓練データがあります。さらに特別なのは、統一された「次のトークン予測」目標を採用していることで、モデルが画像とテキストを処理する際に、同じことを考えているかのように自然に処理できることです。それだけではありません。Emu3.5を単なる「記憶の達人」以上のものにするために、研究チームは強化学習（RL）技術も導入しました。この一手により、モデルはより優れた思考力と概念統合能力を学び、複雑なタスクに直面したときに、より賢く、より論理的に振る舞うようになりました。 DiDA技術：速度を20倍向上させる秘密兵器 AIが生成するコンテンツの速度がいつも少し遅いと感じているなら、Emu3.5がもたらす変化に驚くかもしれません。その重要な新機能の1つが、**離散拡散適応（Discrete Diffusion Adaptation、略してDiDA）**です。これは少し複雑に聞こえるかもしれませんが、その効果は非常に直接的です。生成品質を一切犠牲にすることなく、双方向の並列予測を通じて推論速度を実に20倍も向上させます！これは何を意味するのでしょうか？以前は1分待たなければならなかった複雑な画像編集が、今ではわずか数秒で完了するかもしれません。この速度の飛躍は、リアルタイムの創作やインタラクティブなアプリケーションに全く新しい可能性を開きます。データが物語る：Emu3.5は複数のベンチマークで傑出もちろん、どんなモデルの発表も実力で語られなければなりません。公式に発表されたデータチャートを見ると、Emu3.5のパフォーマンスは確かに印象的です。上の図(a)の比較では、Emu3.5（紫色のバー）は、LongText-Bench、LeX-Bench、CVTG-2Kなど、複数の画像生成・編集ベンチマークにおいて、業界トップのQwen-Image/Editモデルと遜色ない性能を発揮し、一部の項目ではそれを上回り、GPT-Image-1やGoogleのNano Bananaを大幅に上回っています。直接対決：Google Nano Bananaに完勝さらに興味深いのは、Emu3.5とGoogle Gemini 2.5 Flash Image（コードネーム：Nano Banana）との直接対決です。下の図(b)の勝率円グラフからわかるように、Emu3.5は4つの主要な分野すべてで優位に立っています。世界探査（World Exploration）：勝率は65.5%に達します。これは、モデルが仮想環境の理解とナビゲーションに優れていることを示しています。身体操作（Embodied Manipulation）：勝率はさらに67.1%に達し、現実世界の物理的な相互作用をシミュレートする上での潜在能力を示しています。視覚的誘導（Visual Guidance）：勝率は51.5%です。視覚的物語（Visual Narrative）：勝率も半数に近く、49.2%に達します。これらのデータは、Emu3.5が単なる画像生成器ではなく、動的な世界を理解し予測する上で、より深いレベルの能力を示していることを明確に示しています。画像を生成するだけでなく、現実世界のアクターでもある Emu3.5のもう1つの大きな特徴は、内蔵のマルチモーダル入力・出力機能です。これにより、視覚情報とテキストが混在する複雑なシーケンスを簡単に処理でき、長期的に一貫した創作が必要なタスク（例えば、物語に基づいて一連のイラストを生成するなど）や、現実世界のロボット操作にも余裕で対応できます。これは、ロボットの行動をシミュレートする「身体操作」のようなタスクで、なぜこれほど優れたパフォーマンスを発揮するのかを説明しています。次のステップを予測できるモデルは、当然ながら優れた「アクター」になる可能性も秘めています。将来の展望とリソース要約すると、Emu3.5の発表は、マルチモーダルAI分野に新たな基準を打ち立てました。性能面でトップモデルと肩を並べるだけでなく、革新的なDiDA技術によって生成速度のボトルネックを解消し、同時に現実世界の相互作用をシミュレートする上で大きな可能性を示しました。開発者や研究者にとって、これは間違いなくエキサイティングなニュースです。チームは関連リソースを公開しており、興味のある方はぜひご覧ください。 GitHub： https://github.com/baaivision/Emu3.5 Hugging Face： https://huggingface.co/collections/BAAI/emu35 (現在、ページには「近日公開」と表示されており、注目に値します！) よくある質問（FAQ） Q1：Emu3.5と他のモデル（Geminiなど）との最大の違いは何ですか？ Emu3.5の最大の違いは、革新的なDiDA技術にあります。品質を犠牲にすることなく推論速度を20倍向上させることができ、これはリアルタイムアプリケーションにおいて大きな利点です。さらに、「ワールドモデル」として、その設計思想は連続的な視覚言語ステップをより良く予測することにあり、これにより長期的な創作や物理的な相互作用のシミュレーションなどのタスクでより大きな可能性を秘めています。 Q2：「ワールドモデル」とは何ですか？SFのように聞こえます。簡単に言うと、「ワールドモデル」とは、データ内のパターンを学習するだけでなく、環境（現実世界であれ仮想世界であれ）の内部ルールや物理法則を理解しようとするAIのことです。この理解を通じて、「これをしたら次に何が起こるか」を予測することができ、これにより計画、推論、環境との相互作用において従来のモデルよりも優れています。 Q3：DiDA技術は本当にそんなにすごいのですか？はい。AI生成の分野では、速度と品質の両立は難しいことが多いです。多くの高速化技術は、詳細の損失や完成品の品質低下につながります。DiDA技術は、高品質の出力を維持しながら20倍の高速化を実現できるため、これはエンジニアリング上の大きなブレークスルーであり、この種のモデルの実用的なシナリオを大幅に拡大します。

Oct 31, 2025 Read →

G …

news

Google Skillsが新登場：AIスキルを無料で学び、トップ企業への直通ルートを手に入れよう！

Googleは、DeepMindやGoogle Cloudなどのトップリソースを統合した新しいAI学習プラットフォーム「Google Skills」を立ち上げました。無料のコース、実践的なラボ、就職チャネルを提供し、AIスキルを簡単に習得してキャリアの新しい章を開くお手伝いをします。 AIの波が世界中を席巻する今日、あなたも漠然とした不安を感じていませんか？AIを学ばないと時代に乗り遅れてしまうような気がする。しかし、問題は、AIの知識への参入障壁は高く、授業料は法外に高いように思えることです。ご心配なく、Googleは皆さんの声に耳を傾け、この行き詰まりを打破することを誓って、新しい学習プラットフォームGoogle Skillsを立ち上げました。このプラットフォームは、単なるオンラインコースの寄せ集めではありません。Geminiモデルの開発を担当するチーム、DeepMindのAI研究のエッセンス、Google CloudとGoogle for Educationの実践的なコンテンツなど、Google内のトップリソースを統合しています。簡単に言えば、Googleが初めて自社の宝の山であるAIナレッジベースを体系的に世界に公開したようなものです。初心者の方、転職を考えている社会人の方、チームのレベルアップを図りたい経営者の方など、このプラットフォームはあらゆるニーズに応えます。 Google Skillsの何が特別なのか？単なる授業ではない市場には無数のオンラインコースプラットフォームがありますが、Google Skillsはまったく異なる学習体験を提供します。一方的な知識の伝達だけでなく、「実践による学習」を重視しています。 Googleのトップエキスパートによる講義、内容は非常に価値が高いこれまで、DeepMindのAI研究のノウハウに触れるには、トップクラスの学術機関に潜り込む必要があったかもしれません。今、Google Skillsはこのコンテンツをあなたの目の前に直接もたらします。「Grow with Google」の入門コース「Google AI Essentials」から始めて基本的な理解を深め、「Google Cloud」の専門認定に挑戦したり、「Google DeepMind」の「AI Research Foundations」を深く掘り下げて大規模言語モデルの動作原理を徹底的に理解したりすることができます。時間がない？問題ありません。プラットフォームでは、10分間の「AI Boost Bites」ショートコースも提供しており、細切れの時間を利用して素早く充電できます。ビジネスリーダー向けには、「Future-Proof Your AI Learning Strategy」のような高度なコースもあり、Telusやドイツ銀行などの国際企業の具体的な戦略を直接共有しています。見るだけでなく、手を動かすこれこそがGoogle Skillsの真髄です。プラットフォームでは、実際のクラウド環境で操作する700以上のラボを提供しています。もはやビデオを見て先生の真似をしてコーディングするだけでなく、モデルの構築からアプリケーションのデプロイまで、指定された演習タスクを自分で完了し、段階的に実践的な経験を積む必要があります。行き詰まったらどうする？心配しないでください。AIティーチングアシスタントのGemini Code Assistがいつでも待機しています。間違ったコードを書いたり、解決策が思いつかなかったりすると、リアルタイムでヒントやフィードバックを与えてくれ、まるでそばにいるシニアエンジニアに指導してもらっているかのようです。ゲームのように学び、モチベーションを維持学習で最も恐ろしいのは退屈です。統計によると、学習者の95%がゲーミフィケーション体験によってより熱中できると考えています。Google Skillsはこのことをよく理解しており、連続学習日数を記録する「ストリーク」や、ソーシャルメディアで共有できる達成バッジなど、多くの興味深いデザインを取り入れています。自分の成果が積み重なっていくのを見ると、学習は自然と楽しいものになります。スキルを学ぶだけでなく、良い仕事を見つける手助けも証明書を取得したら、次は何をしますか？これは、オンラインコースを修了した多くの人が抱く共通の疑問です。Google Skillsはすでに次のステップを考えています。彼らは150社以上の企業からなる「採用コンソーシアム」を設立しました。特定のコースを修了し、公式に認定されたスキルバッジまたは証明書を取得すると、業界で高く評価されている証明書（採用担当者の82%以上が有効な職業資格として認めている）を手に入れるだけでなく、これらの提携企業のタレントプールに直接入る機会も得られます。 Jack Henryのような企業は、この「スキルベースの採用プログラム」に積極的に参加しており、Google Cloud認定を修了した学生に、学習と職場のニーズを直接結びつける、迅速な就職ルートを提供しています。始め方とは？重要なのは、無料にできるということです！ここまで聞いて、「こんなに素晴らしいリソースは高価に違いない」と思うかもしれません。

Oct 24, 2025 Read →

G …

news

Googleの謎の新型モデルがLMArenaに登場、Gemini 3.0 Proの登場か？

AIアリーナLMArenaに最近、「lithiumflow」と「orionmist」という2つの謎のGoogleモデルが登場しました。すべての兆候は、これが待望のGemini 3.0 Proであることを示しており、その強力なパフォーマンスと特殊な能力はコミュニティで激しい議論を巻き起こしています。最近、有名なAIモデル競争プラットフォームLMArenaに、Googleからの2つの新しい顔、「lithiumflow」と「orionmist」が静かに登場しました。この発見は、AI愛好家や開発者コミュニティの間でたちまち話題になりました。誰もが、これが噂のGoogleの次世代フラッグシップモデル、Gemini 3.0ではないかと推測しています。すべての兆候がその答えを示しているようです。コードネームが天機を漏らす？Gemini 3.0の可能性 Googleの命名規則に詳しい関係者は、すぐに手がかりに気づきました。噂によると、「orion」というコードネームは、Google内部で常にGemini 3の開発コードネームに関連付けられてきました。今回登場した「orionmist」モデルは、自然と人々にGemini 3ファミリーとの関連を想起させます。さらに、いくつかのオンラインディスカッションや分析によると、「lithiumflow」はGemini 3.0 Proバージョンであり、「orionmist」はより軽量なFlashバージョンに対応するのではないかと広く推測されています。Googleはまだ公式に確認していませんが、このような「偽名」での先行テストは、AI業界ではよくあることです。ベンチマークが強いだけじゃない、特殊スキルも満載モデルの良し悪しは、やはり実力次第です。LMArenaで幸運にも新しいモデルに遭遇したユーザーからのフィードバックを見ると、「lithiumflow」と「orionmist」のパフォーマンスは期待を裏切りませんでした。 simplebenchなどのいくつかの予備的なベンチマークテストでは、新しいモデルは8〜10点（満点10点）という高得点を記録し、既存のGemini 2.5 Proを大幅に上回りました。これは、論理的推論、コード生成、常識的な質疑応答などの総合的な能力が大幅に向上したことを意味します。しかし、ユーザーが最も話題にしているのは、そのいくつかの「特殊な才能」です。見事なロールプレイング: AIとのロールプレイングインタラクションを楽しむユーザーにとって、これは間違いなく朗報です。新しいモデルのロールプレイング能力は、前世代をはるかに超えています。口調、性格、背景設定など、すべてを正確に把握し、没入感のある体験を提供します。強力なSVG処理能力: もう1つの驚くべきハイライトは、スケーラブルベクターグラフィックス（SVG）を処理する能力です。「自転車に乗るペリカン」のSVG画像を生成するように依頼すると、この少しばかげたコマンドを理解するだけでなく、構造が完全でスタイリッシュなSVGコードを生成できます。これは、過去に多くのトップモデルを悩ませてきたタスクです。 HTMLコンテンツ生成: SVGに加えて、新しいモデルはHTMLコンテンツも処理できます。たとえば、天気カードやカタパルトの簡単なWebページモデルを生成できます。これは、フロントエンドのコード生成とマルチモーダル理解におけるその可能性を示しています。特筆すべきは、機能が大幅に強化されたにもかかわらず、新しいモデルのコンテキスト長（Context Length）は驚異的な100万トークンを維持していることです。これは、非常に大量の情報を処理および記憶できることを意味し、長いレポートやコードベースの分析などの複雑なタスクにとって非常に重要です。どうすれば自分で体験できますか？これらの2つの謎のモデルを自分で試してみたいですか？方法は簡単です。LMArena.aiのWebサイトにアクセスし、「Battle」モードをクリックします。システムは、比較テストのために2つの匿名モデルをランダムに割り当てます。運が良ければ、「lithiumflow」または「orionmist」というコードネームのGoogleの新しいモデルに遭遇する可能性があります。よくある質問（FAQ）質問：これらの2つの新しいモデルは、Gemini 3.0 Proで確定ですか？回答：現在、Googleはまだ公式に発表していません。ただし、内部コードネーム「orion」とLMArenaでの強力なパフォーマンスに基づくと、コミュニティはこれがGemini 3.0 Proまたはその初期テストバージョンである可能性が非常に高いと考えています。質問：新しいモデルはGemini 2.5 Proよりどこが強いですか？回答：予備的なテストから、新しいモデルは総合的なパフォーマンスでGemini 2.5 Proを上回っており、特にロールプレイング、SVG画像生成、HTMLコンテンツ処理などの特定の分野で大きな利点を示しています。質問：これらの新しいモデルはどのように使用できますか？回答：現在、これらのモデルを体験する唯一の方法は、LMArenaプラットフォームの「Battle」モードを介して、ランダムなペアリングで遭遇することです。近い将来、GoogleがGemini Advancedまたは他の製品ラインに正式に統合することが期待されています。

Oct 20, 2025 Read →