AI日報 | Claude Opus 4.8 動的ワークフローが衝撃のリリース、エッジおよびオープンソースモデルの性能が大幅向上

I発展日報：Claude Opus

調性を発揮 Anthropicは、市場で大

aceおよびGitHubで公開し、各

ありますか？Liquid AIが新た

a.cpp、vLLM、SGLan

Qwen-Image

news

AI日報 | Claude Opus 4.8 動的ワークフローが衝撃のリリース、エッジおよびオープンソースモデルの性能が大幅向上

2026-05-29

AI発展日報：Claude Opus 4.8が登場、衝撃の動的ワークフローとエッジ・オープンソースモデルの性能爆発

正直なところ、人工知能技術の最新の進展を毎日追いかけるのは、時として息切れしそうになることもあります。昨日ようやく新しい用語を理解したと思ったら、今日また全く新しい計算アーキテクチャが登場する。しかし、それこそがテクノロジー界の最も魅力的な部分でもあります。今日の厳選された内容は、リリースされたばかりの重要モデルや実用的なツールを垣間見せてくれます。クラウド大手のフラッグシップモデルの重大アップデートから、古いノートPCでもスムーズに動作するエッジ技術まで、あらゆる場面に味わい深い技術的工夫が詰まっています。

Claude Opus 4.8とClaude Codeの動的ワークフローが驚異的な協調性を発揮

Anthropicは、市場で大きな注目を集めていたClaude Opus 4.8を正式にリリースしました。この新モデルはOpus 4.7の強固な基盤の上に構築されており、従来の価格を維持しつつ、各種ベンチマークテストにおいて極めて信頼性の高い判断力を示しています。

業界には非常に興味深い現象がありました。これまでの多くの言語モデルは、分かったふりをして自信満々に誤った答えを出したり、実際には終わっていないタスクを完了したと主張したりすることがよくありました。今回のOpus 4.8チームは、特に「誠実さ」という特質を強調しています。初期テスターの実際のフィードバックによると、不確かな状況に遭遇した際、潜在的な疑念を能動的にマークするようになっています。前世代と比較して、コードの脆弱性を見逃す確率は実に4分の1にまで低下しました。これは些細なことに聞こえるかもしれませんが、毎日膨大なコードを扱うエンジニアにとっては、安心して眠りにつけるアップグレードと言えるでしょう。また、ユーザーは新しいEffort Control（努力制御）機能を通じて、単一のタスクに投入する計算リソースを正確に制御できるようになり、従来の3分の1の価格で利用できる高速モードへの切り替えも可能です。

プログラミングといえば、Claude Codeで同時に導入された「動的ワークフロー (Dynamic workflows)」という新機能に触れないわけにはいきません。この機能は、AIがいかに超大規模なソフトウェアエンジニアリングの問題を処理できるかを完璧に示しています。通常ならエンジニアチーム全体で数四半期を要するライブラリ移行プロジェクトが、わずか数日に短縮されることを想像してみてください。システムは動的に調整スクリプトを作成し、単一のセッションで数十、あるいは数百の並列動作するサブエージェントを起動し、ユーザーに報告する前に自身の出力を慎重に検証します。

有名なJavaScript実行環境であるBunは、最近この機能を利用して、ZigからRustへの約75万行のコード変換をわずか11日間で完了させました。このような極めて複雑な協調こそが、Opus 4.8と動的ワークフローの組み合わせがもたらした実質的な技術的突破口です。

Step 3.7 Flashが極限のコストパフォーマンスとビジュアルエージェント能力を披露

クラウド大手の華々しい活躍に続き、オープンソースとAPI分野の強力なダークホースを見てみましょう。Step 3.7 Flashの登場は、間違いなくエージェントの実行効率に新たな基準を打ち立てました。

このモデルは合計198Bのパラメータを持ちながら、アクティブなパラメータはわずか11Bです。一見巨大に見えますが、実際の推論コストは驚くほど低く抑えられています。開発チームはこのモデルをHugging FaceおよびGitHubで公開し、各界での研究利用に供しています。SWE-bench Proなどのコード作成やソフトウェアエンジニアリングタスクにおいて、極めて高い水準の正確さを発揮しています。

さらに興味深いのは、マルチモーダルとビジュアル検索の制御能力です。Step 3.7 Flashは複雑なWebインターフェース、ドキュメント、図表を理解できるだけでなく、自身が「見た」視覚的コンテキストに基づいてコードを書いたり、外部ツールを呼び出したりすることも可能です。視覚認識と論理推論をシームレスに組み合わせたこの設計により、複雑なWeb検索やロングテールエンティティの認識において、同クラスのモデルを遥かに凌ぐ実力を発揮します。こうした控えめに見えるモデルこそが、実際のデプロイ時に予想外の驚きをもたらすものです。

LFM2.5-8B-A1Bが古いハードウェアでも混合専門家モデルを軽快に動作させる

普通のノートPCで強力な混合専門家モデル（MoE）を動かすことを考えたことがありますか？Liquid AIが新たにリリースしたLFM2.5-8B-A1Bは、それを現実にしました。

コミュニティでは、「ポテト（低スペック）」級の一般的な消費者向けハードウェアでも動くと冗談を言う人もいます。これは決して誇張ではなく、Hugging FaceからGGUF形式のファイルをダウンロードして、いつでも自分で体験できます。これはエッジデバイス向けに設計されたハイブリッドアーキテクチャモデルで、38Tトークンにも及ぶ事前学習と大規模な強化学習を経て開発されました。

前世代バージョンと比較して最も顕著な変更点は、コンテキスト長が一気に128Kに拡張されたことと、語彙サイズが倍増したことです。これにより、非ラテン語圏のトークナイズ効率が大幅に向上しました。極めて低いハードウェア要件を維持しながら、優れたツール呼び出し能力と指示追従レベルを備えており、llama.cpp、vLLM、SGLangなど多様な推論フレームワークをサポートしています。将来のスマートフォンや薄型ノートPCは、完全にオフラインで高いプライバシー保護を備えた専用デジタルアシスタントを持つことになるでしょう。強力な計算力を日常のデバイスに凝縮することは、現在のテクノロジー発展において非常に重要な方向性です。

Qwen-Image-BenchがAI画像の客観的評価を行う専任審判に

画像生成AI技術の普及に伴い、避けられない課題が浮上してきました。生成されたAI画像が本当に良いかどうかをいかに客観的に評価するかという点です。この課題を解決するため、QwenチームはQwen-Image-Bench（GitHubでも同時公開）をリリースし、Q-Judgerという専任のAI審判を導入しました。

Q-Judgerは、Qwen3.6-27Bをファインチューニングしたビジュアル言語モデルです。その仕組みは非常に直感的で、プロンプトと生成された画像を入力すると、モデルは思考の連鎖 (Chain-of-Thought) を用いて綿密な推論を行い、最終的に構造化されたJSON評価データを出力します。

評価基準は決して甘くなく、以下の5つの非常に詳細な主要次元を網羅しています。

品質 (Quality)：物理的なロジックや質感の表現が妥当かを厳格に精査し、ノイズやエッジの明瞭度をチェックします。
美学 (Aesthetics)：構図のバランス、色彩の調和、光と影の雰囲気、さらには人物解剖学的な忠実度にも着目します。
アライメント (Alignment)：プロンプトが要求した数量、動作、空間配置が正確に表現されているかを確認します。
現実世界の忠実度 (Real-world Fidelity)：社会的偏見、文化的公平性、安全コンプライアンスを厳格に管理します。
クリエイティブ生成 (Creative Generation)：視覚的なストーリーテリング能力、カメラワークの言語、各種デザインへの応用可能性に焦点を当てます。

感性的な美学を具体的な定量的指標に変換するこの試みは、将来の画像生成分野においてより明確な最適化の指針を提供してくれます。

PaddleOCR-VL 1.6がドキュメント解析と光学文字認識の精度限界を更新

最後に、極めて実用的でありながら過小評価されがちな分野、光学文字認識（OCR）と複雑なドキュメント解析を見てみましょう。PaddlePaddleが発表した最新のPaddleOCR-VL 1.6は、この分野で驚くべき成果を上げました。

公式発表データによると、このビジュアル言語モデルは厳格なOmniDocBench評価において96.33%という新たなSOTA記録を樹立しました。興味のある開発者は、Hugging Faceのページで実際の仕様を確認できます。

さらに素晴らしいのは、複雑な表構造、古典文献、稀少文字、さらには識別が困難な印影や図表の処理において、飛躍的な進歩を遂げたことです。大規模言語モデル（LLM）の知識ベース構築や検索拡張生成（RAG）システムを必要とする企業にとって、高品質なデータ導入を提供できることは、まさに福音と言えます。このモデルはv1.5アーキテクチャと完全な互換性があり、プラグアンドプレイを標榜しているため、苦痛を伴うシステム移行プロセスを完全に省略できます。

今日のテクノロジー発展は、単なるパラメータサイズの競争から脱却し、実用性、推論の精度、そして異なるハードウェアの制約下でいかに最大の価値を発揮するかを追求する方向へとシフトしています。計算効率と究極の応用を追求し続けるこの潮流は、今後も想像を超えるイノベーションをもたらし続けるに違いありません。

Q&A

Q1：Claudeの「動的ワークフロー (Dynamic workflows)」とは何ですか？実際の応用でどのような驚くべきパフォーマンスを見せていますか？ A1： 動的ワークフローは、Claudeが超大規模なソフトウェアエンジニアリングの問題を処理できるようにする新機能です。調整スクリプトを動的に作成し、単一のセッションで数十から数百の並列動作するサブエージェントを起動し、ユーザーに報告する前に結果を慎重に検証します。実際の応用例として、有名なJavaScript実行環境Bunの開発者はこの機能を利用し、わずか11日間で約75万行のコードをZigからRustへ変換し、テストスイートの99.8%をパスさせることに成功しました。

Q2：Step 3.7 Flashは極めて高いコストパフォーマンスを謳っていますが、実際のパラメータ数は？ビジュアルエージェント能力における特殊な進歩は何ですか？ A2： Step 3.7 Flashは、合計198Bのパラメータ（196Bの言語バックボーンと1.8Bのビジュアルエンコーダを含む）を持つ混合専門家モデル（MoE）ですが、アクティブなパラメータは約11Bに過ぎません。複雑なWebインターフェースや図表を理解できるだけでなく、最大の進歩は「Pythonツール」を使用して画像と深く対話（クロップ、ズーム、バウンディングボックスの描画など）できる点にあります。特別な訓練なしに、「視覚ツール」と「非視覚ツール」を組み合わせて複雑なタスクを完了する能力を自然に発揮します。

Q3：Liquid AIのLFM2.5-8B-A1Bが一般的なノートPCやスマートフォンでもスムーズに動作するのはなぜですか？ A3： LFM2.5-8B-A1Bはエッジデバイス向けに特別に設計された混合専門家モデルで、「推論専用 (reasoning-only)」の設計戦略を採用しています。エッジデバイスは計算リソースが制限されていることが多いですが、アクティブパラメータが極めて少ないため、各推論トークンの計算コストが非常に低く抑えられ、速度を犠牲にすることなく品質を大幅に向上させています。また、llama.cppやMLXなど多様なフレームワークを初日からサポートしており、Apple M5 Maxチップでは毎秒253トークンのデコード速度を達成しています。語彙サイズも128Kに倍増し、アラビア語などの非ラテン語圏の処理効率を大幅に向上させました。

Q4：AI生成画像は客観的な評価が難しいことが多いですが、QwenチームのQ-Judgerモデルはどのようにこの問題を解決していますか？ A4： Q-JudgerはQwen3.6-27Bをファインチューニングしたビジュアル言語モデルです。プロンプトと画像を入力すると、「思考の連鎖 (Chain-of-Thought)」を起動して綿密な推論を行い、構造化されたJSON評価データを出力します。品質、美学、アライメント、現実世界の忠実度、クリエイティブ生成の5つの主要次元に基づいて厳格に定量評価を行い、主観的な美感を客観的な最適化指標に変換します。

Q5：知識ベースの構築を必要とする企業にとって、PaddleOCR-VL 1.6のリリースはどのような実質的な助けとなりますか？ A5： PaddleOCR-VL 1.6は、厳格なOmniDocBench評価で96.33%という新たなSOTA記録を樹立し、多くのオープンソースおよび商用ソリューションを上回りました。複雑な表、古典テキスト、稀少文字、さらには印影や図表の認識精度を著しく向上させました。さらに重要なのは、v1.5アーキテクチャと完全な互換性があるため、企業開発者は移行コストゼロで「プラグアンドプレイ」でのデプロイが可能になり、高品質なデータをLLMやRAGシステムに簡単に導入できるようになった点です。

Featured Partners

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

Recommended for You

A …

news

AI日報｜Kimiが2.8兆パラメータのK3モデルをリリース、Geminiエージェントが稼働、Xiaomiがロボットのデータ障壁を突破

AI日報｜Kimiが2.8兆パラメータのK3モデルをリリース、Geminiエージェントが稼働、Xiaomiがロボットのデータ障壁を突破今日のAI界隈も賑やかです。Kimiは2.8兆パラメータのオープンソースの怪物モデルを投入し、GoogleはAIエージェントが開発者の予算を使い切らないように工夫しており、OpenAIはユーザーのホームディレクトリを削除してしまうという大失態の修正に追われています。今日のまとめは以下の通りです。 2.8兆パラメータのオープンソースの怪物：Kimi K3 Kimiは、2.8兆パラメータを持つオープンソースモデル Kimi K3: Open Frontier Intelligence をリリースし、100万トークンのコンテキスト長をサポートしました。アーキテクチャ面では、KDAとAttnResを組み合わせて長文の注意機能と特徴抽出を処理し、Stable LatentMoE技術を通じて896個の専門家ネットワークのうち16個を精密にアクティブ化します。最も注目すべきは、ナノチップの設計と検証を48時間以内に自律的に完了したことです。Claude Fable 5やGPT 5.6 Solを全面的に超えたわけではありませんが、K3は現在、オープンソース界で無視できない重量級の選手です。視覚知覚の真相：PerceptionBench評価私たちはAIが画像を理解できると思っていますが、多くの場合、ただの当てずっぽうです。Kimiチームがリリースした PerceptionBench は、「視覚知覚」と「論理的推論」を分けてテストします。計数、深度知覚、空間位置決めなど3,000問を含むこのテストは、悲惨な現実を明らかにしました：現在、正解率が60%を超えるモデルは市場に存在しません。 OpenAIの青少年保護ネット多くのティーンエイジャーが学習にChatGPTを頼っているため、OpenAIは専用の「学習モード」(Study Mode) をリリースしました。このモードは直接回答を提供するのではなく、質問を通じて思考を導きます。保護者用オプションと組み合わせることで、静かな時間を設定したり、敏感なコンテンツをフィルタリングしたりできます。Family Online Safety Instituteなどの組織も関連する協力の推進に参加しています。 Google検索が外部アプリを統合 Google検索のAIモードは、現在外部アプリケーションを直接連携できるようになりました。AIにバーベキューのメニューを計画させる際、Instacartを通じて直接食材をショッピングカートに入れて決済できます。ポスターが必要ならCanvaテンプレートを呼び出し、音楽を聴きたいならYouTube Musicに連動してワンクリックで再生できます。 Gemini Notebookが登場人気のNotebookLMはGemini Notebookに正式名称変更されました。今回は、Google AI UltraおよびWorkspaceビジネスユーザー向けにクラウドコンピューティング環境が開放されました。つまり、あなたのデジタルノートブックで直接コードを記述、実行し、複雑なデータ分析を処理できるようになりました。 AIの暴走を防ぐGemini API管理エージェント AIエージェントを自律的に動作させる際、最も恐ろしいのは予算のコントロール不能です。Googleが新たにリリースした Gemini Interactions API により、エージェントは隔離されたクラウドサンドボックス内でコードを書いたり、ネットサーフィンをしたりできます。予算の問題を解決するため、Googleは予算制御オプションを追加しました。開発者は max_total_tokens を設定するだけで直接ブレーキをかけることができます。また、新たに追加されたスケジュールトリガーにより、エージェントが毎日のデバッグやコードのクリーニングを自動実行できるようになりました。詳細は公式ドキュメントを参照してください。 Muse Spark 1.1がオンラインに Metaの Muse Spark 1.1 がOpenRouterプラットフォームに正式上陸し、米国の開発者により多様なモデルオプションを提供してアプリケーションを構築できるようになりました。

Jul 17, 2026 Read →

A …

news

AI日報｜Xプラットフォームの全面オープンソース化を約束、OpenAIが物理キーボード「Codex Micro」を発売、SpaceXAIがGrok Buildのソースコードを公開

AI日報｜Xプラットフォームの全面オープンソース化を約束、OpenAIが物理キーボード「Codex Micro」を発売、SpaceXAIがGrok Buildのソースコードを公開今日の主要ニュースは、ソーシャルプラットフォームの完全透明化計画、物理的なハードウェアの革新、そして主要なAIツールの全面的なアップグレードを網羅しており、最先端技術が日々の開発や生活に完全に統合されていることを示しています。以下に、今日の話題のトピックと新しいツールの応用を整理してご紹介します。 1. イーロン・マスクがXプラットフォームのコードの全面オープンソース化を約束イーロン・マスクは最近、Xプラットフォーム上のツイートで、セキュリティ脆弱性の審査が完了次第、Xプラットフォームのソースコードを完全に例外なく公開することを約束しました。完全な透明性を確保するため、公式チームは第三者の審査員を招き、実際に動作しているシステムを検証し、公開されたソースコードと実際の動作システムが一致しているかを照合する予定です。将来的には、誰もがXプラットフォーム上で動作するアルゴリズムを自ら検証できるようになります。完全な透明性によって信頼を構築することは、アルゴリズムの偏見に対する懸念を解消するための効果的な解決策であり、テクノロジー業界全体にとって非常に高い指標的意義を持っています。 Once we have completed our review for security vulnerabilities, we will make the entire codebase of 𝕏 open source, with no exceptions. Moreover, we will invite third party reviewers to examine the system that is running to confirm that the open source code is what is running.…

Jul 16, 2026 Read →

A …

news

AI日報：Cursorのゼロデイ脆弱性、モバイル向け27BモデルBonsai誕生、Claudeの教師専用アシスタント登場

AI日報：Cursorのゼロデイ脆弱性、モバイル向け27BモデルBonsai誕生、Claudeの教師専用アシスタント登場テクノロジー界のニュースは毎日山ほどあり、息つく暇もありません。新しいモデルや技術が次々と登場し、専門家でさえ理解するのに苦労することもあります。しかしご安心ください。ここでは、最も新鮮で話題性の高いテクノロジーの焦点を整理してお届けします。スマートフォンで動作する超大規模言語モデルから、セキュリティ上の懸念を引き起こす開発ツールまで、今日は実用的な情報が満載です。それでは、少し歩みを緩めて、これらの新しいテクノロジーの知識をじっくりと味わってみてください。 27Bの大規模モデルをスマホに詰め込む？PrismMLが実現正直なところ、これまでローカルデバイス上で大規模言語モデルをスムーズに実行することは、ハードウェア仕様の観点から見て、乗り越えるのが難しい高い壁でした。今回、PrismMLは、スマートフォン上のローカルでスムーズに動作する世界初の27Bクラス大規模言語モデル「Bonsai 27B」を正式に発表しました。少し信じられないような話ですが、説明しましょう。PrismMLチームは、独自の1ビット量子化技術と「インテリジェンス密度（Intelligence Density）」のコンセプトを通じて、この巨大なモデルをわずか3.9GBに圧縮しました。この軽量さにより、クラウドサーバーに頼ることなく、スマートフォン上で複雑なマルチモーダルタスクを直接実行できるようになりました。この手法の利点は明らかです。ネットワーク遅延が大幅に削減されるだけでなく、さらに重要なのは、データがユーザーのスマートフォンから一切外部に出ないということです。プライバシー保護を非常に重視するユーザーにとって、これは間違いなく朗報です。技術的な詳細に興味がある方は、PrismML公式サイトで詳細を確認できます。セキュリティ通知を無視？Cursorにゼロデイ脆弱性、開発者の安全は誰が守る？多くの開発者が愛用しているAI補助プログラミングツール「Cursor」が、最近大きなトラブルに見舞われています。セキュリティ研究機関のMindgardが、非常に深刻なゼロデイ脆弱性を公表し、開発界隈を騒然とさせています。説明しましょう。これは一見単純ですが、非常に危険な脆弱性です。Windowsシステム上で開発者がCursorを使ってプロジェクトフォルダーを開く際、このフォルダーのルートに悪意を持って改ざんされた git.exe ファイルが隠されていると、Cursorは警告やクリック権限を一切求めることなく、自動的にそれを実行してしまいます。これは門戸を大きく開き、ハッカーに任意のコード実行権限を簡単に与えてしまうことを意味します。セキュリティ界で最も不満を持たれているのは、Mindgardが数ヶ月前（2025年12月）にこの問題を報告していたにもかかわらず、Cursor公式が有意義な回答を先延ばしにし、7ヶ月間と70以上のバージョン更新を経ても脆弱性が依然として残っているという事実です。コミュニケーションが取れない中、研究チームは「全面公開（Full Disclosure）」という最後の手段をとらざるを得ませんでした。防護策を理解したい開発者は、Mindgardの完全な分析レポートを読むことを強く推奨します。「適時黙る」を知るAI？OpenMOSSが開源したリアルタイム視覚理解モデル動画解析は、非常に計算リソースを消費する課題です。OpenMOSSチームは最近、リアルタイム動画理解用に設計された110億パラメータのモデル「MOSS-VL-Realtime」をオープンソース化しました。このモデルで最も驚くべき点は、最大256Kという超長文脈（コンテキスト）をサポートしていることです。これは、ユーザーが動画再生のどの時点でも、いつでもAIに質問できることを意味します。ここがポイントですが、このモデルには非常に人間味のある特徴があり、それは自発的に沈黙を保つ能力です。画面上の視覚情報が不十分な場合や、重要な出来事がまだ発生していない場合、より多くの画面を取得するまで静かに待ち、その後正確な回答を行うことを選択します。この「適時黙る」ことを知る特性により、スマート監視やリアルタイム解析の分野で特に価値が高まっています。これは不必要な計算の無駄を省くだけでなく、回答の正確性を大幅に向上させました。開発者はOpenMOSSのGitHubページからソースコードを取得し、実際に体験できます。話し手のトーンさえ模倣！GoogleがGemini 3.5のリアルタイム音声翻訳アプリを共有言葉の壁は、グローバル化の発展における長年の痛みでした。Google AI開発者公式アカウントは最近、各開発チームがいかに巧みにGemini 3.5 Live Translateを活用してグローバルな多言語アプリを構築しているかを共有しました。この強力なモデルは、70以上の言語のリアルタイム翻訳をサポートしています。最も素晴らしいのは、単に文字を変換するだけでなく、話し手のオリジナルのトーン、速度、さらには音高まで保持できることです。このような自然なインタラクション方法により、言語を越えたコミュニケーションが非常にスムーズになります。東南アジアのスーパーアプリGrabは、この技術を積極的に探求し、ドライバーと乗客の間のコミュニケーションの障害を取り除こうとしています。さらに、LiveKit、Software Mansion、VisionAgentsなどのトップチームも、すでに自社サービスへの統合に成功しています。彼らは、超低遅延の多言語リアルタイムビデオ通話、ライブストリーム翻訳、および動的に言語を切り替えることができるまったく新しい体験を開発しました。興味のある方は、Google AI開発者のXプラットフォームの投稿で実際のデモ動画を見ることができます。授業準備の救世主！Anthropicが教師専用Claudeアシスタントを発表教育関係者の日々の業務はすでに非常に多忙です。疲れを知らない有能な助手がいたらどんなに良いでしょうか？Anthropicは、米国のK-12（幼稚園から高校まで）段階の教育関係者向けに、プレミアムAIサービスを無料で提供する「Claude for Teachers」を発表しました。このツールは、単なる暇つぶしのチャットボットではありません。米国の50州すべての教育基準と専門的なカリキュラムリソースが内蔵されています。教師はいくつかの簡単な要件を入力するだけで、Claudeがすぐに学習指導要領に完全に準拠した教案を生成し、さらには学生の習熟度に合わせて難易度を変えた教材を提供することもできます。プライバシーの問題も当然、誰もが最も懸念することです。Anthropicは、このサービスには特別なプライバシー保護条項が適用され、FERPA規範に完全に準拠していることを強調しています。教員と学生の会話およびすべてのデータは、トレーニング素材として使用されることは決してありません。申請の詳細については、Anthropicの公式発表を参照してください。ロボットの脳がさらに進化、Xiaomiが380億パラメータの具身知能モデルをオープンソース化ロボットに世界を真に理解させるには、強力な脳システムが不可欠です。Xiaomiロボットチームは最近、パラメータ規模が最大380億に達する世界基礎モデル「Xiaomi-Robotics-U0」を発表し、オープンソース化しました。このモデルはEMU3.5アーキテクチャをベースに初期化されており、テキスト、画像、具身観察データを同期処理するために統一されたトークンスペースを採用しています。これにより、テキストから画像への生成、シーン生成、状態遷移、さらには一連の動画の生成任務さえも容易にこなすことができます。計算をより効率的にするために、Xiaomiチームは専用の「FlashAR」加速技術を組み合わせ、vLLMを完璧にサポートしています。単一のH20グラフィックボード上で、この技術は高解像度画像の生成速度を82倍以上に引き上げました。これは間違いなく、将来の汎用ロボット制御システムにとって非常に強力な基盤を築きました。開発者は、Hugging Face上のXiaomi-Robotics-U0ページから関連する重みをダウンロードできます。 3Dゲームをテストにする？新しいAI評価方法が常識を打破従来の静的な文字の選択問題で、AIの実力を正確に測定できるでしょうか？開発者コミュニティは最近、「WorldBuild Bench」というまったく新しい基準テストを開始し、より面白く、かつ過酷な方法でテストすることにしました。このテストの手法は非常に独特です。Claude Fable 5やGPT-5.6 Solなど、複数の著名なモデルに対し、まったく同じプレゼンテーション要件に基づいて、それぞれ独立してプレイ可能な3Dゲームを開発させます。目的は、ゲームシーンを通じて、AIワールドモデルの空間、時間、因果関係における一貫性のパフォーマンスを検証することです。

Jul 15, 2026 Read →

AI日報 | Claude Opus 4.8 動的ワークフローが衝撃のリリース、エッジおよびオープンソースモデルの性能が大幅向上

AI発展日報：Claude Opus 4.8が登場、衝撃の動的ワークフローとエッジ・オープンソースモデルの性能爆発

Claude Opus 4.8とClaude Codeの動的ワークフローが驚異的な協調性を発揮

Step 3.7 Flashが極限のコストパフォーマンスとビジュアルエージェント能力を披露

LFM2.5-8B-A1Bが古いハードウェアでも混合専門家モデルを軽快に動作させる

Qwen-Image-BenchがAI画像の客観的評価を行う専任審判に

PaddleOCR-VL 1.6がドキュメント解析と光学文字認識の精度限界を更新

Q&A

videoweaver.app

DMflow.chat

DMflow.chat

videoweaver.app

DMflow.chat

DMflow.chat

Recommended for You

AI日報｜Kimiが2.8兆パラメータのK3モデルをリリース、Geminiエージェントが稼働、Xiaomiがロボットのデータ障壁を突破

AI日報｜Xプラットフォームの全面オープンソース化を約束、OpenAIが物理キーボード「Codex Micro」を発売、SpaceXAIがGrok Buildのソースコードを公開

AI日報：Cursorのゼロデイ脆弱性、モバイル向け27BモデルBonsai誕生、Claudeの教師専用アシスタント登場

Leaving Website