Mobile-Agent-v3：Alibabaのオープンソース究極GUIエージェント、スマホとPCのクロスプラットフォーム操作はもはや夢ではない？

AIアシスタントがあなたの指示を理解するだけでなく、人間のようにスマホ、PC、ウェブページを「見て」操作できると想像してみてください。これはSF映画ではなく、AlibabaのX-PLUGチームがオープンソースで公開したMobile-Agent-v3が実現しつつある未来です。本記事では、GitHubのトレンドリストにランクインしたこのプロジェクトと、その背後にあるブラックテクノロジー「GUI-Owl」について詳しく解説します。

スマホやPCが、一連の複雑な操作を自分で完了できたら、どれほどクールか考えたことはありますか？例えば、チャットアプリから住所を自動的にコピーし、地図を開いてナビゲートし、そのルートのスクリーンショットを友人に送信する、といった一連の操作を、指一本動かすことなく完了できるとしたら。

以前は、これは夢物語のように聞こえましたが、今、アリババのX-PLUGチームが、最新のオープンソースプロジェクトMobile-Agent-v3で、それを手の届くものにしました。このプロジェクトは最近、GitHubで話題を呼び、一時はトレンドリストの5位にまで上り詰めました。明らかに、期待は最高潮に達しています。

では、このMobile-Agentとは一体何なのでしょうか？そして、その強みは何なのでしょうか？

単独行動からクロスプラットフォーム連携へ：Mobile-Agentの進化の道

実は、Mobile-Agentは突然現れたわけではありません。今日私たちが見る強力な姿になるまで、一連の進化を遂げてきました。その発展の歴史から、AIエージェント技術の縮図を見ることができます。

Mobile-Agent-v1： 初期のバージョンは、熱心な見習いのように、単一の携帯電話でマルチモーダルな操作を実行することができました。
Mobile-Agent-v2 & E： チームワークを学び始め、マルチエージェントモードに進化し、自己進化能力さえも備え、携帯電話の操作をよりスマートにしました。
PC-Agent： 戦場を携帯電話からPCに拡大し、PC環境でのマルチモーダルな操作を学びました。
GUI-Owl & Mobile-Agent-v3： 究極の形態！すべての能力を統合し、携帯電話、PC、ウェブページを同時に使いこなすことができる、クロスプラットフォームでマルチモーダルなGUIエージェントになりました。

この道のりは、単なる機能の積み重ねではなく、AIが私たちの世界を理解し、対話する方法における根本的な飛躍です。

中核となる頭脳：GUI-Owlの謎を解き明かす

Mobile-Agent-v3がこれほど強力である理由は、その中核となるモデルであるGUI-Owlにあります。

GUI-Owlは、このエージェントの「頭脳と目」と考えることができます。これはネイティブなエンドツーエンドのマルチモーダルエージェントです。この言葉は少し専門的に聞こえるかもしれませんが、分解してみると実は簡単に理解できます。

マルチモーダル： テキストの指示（何をすべきかを伝える）を理解するだけでなく、アイコン、ボタン、画像など、画面上のグラフィカルユーザーインターフェース（GUI）を「見る」ことができます。
エンドツーエンド： 指示の受信から操作の完了まで、意思決定と実行のプロセス全体がシームレスであり、その間の推論プロセスが明確に可視化されています。これにより、複雑な複数ステップのタスクを処理する際に、より安定して信頼性の高いパフォーマンスを発揮します。

簡単に言えば、GUI-OwlはMobile-Agent-v3に、知覚、理解、推論、計画、実行の全方位的な能力を与えます。もはや、固定的な命令を実行するだけのスクリプトではなく、あなたのデバイスを真に「見て」「考えて」操作する方法を知っているインテリジェントな存在なのです。

では、Mobile-Agent-v3は実際に何ができるのか？

技術的な話はこれくらいにして、実際の応用ではどのような点が注目されているのでしょうか？

1. 真のクロスプラットフォーム操作

これが最も魅力的な機能です。Windows、macOS、Androidスマートフォン、さらにはウェブページであっても、Mobile-Agent-v3はシームレスに切り替えて操作できます。つまり、PCソフトウェアとスマートフォンアプリの両方を必要とする複雑なタスクを完了するように命令できるということです。たとえば、PC上のファイルを整理し、その結果をスマートフォンアプリ経由で送信するなどです。

2. 想像を超える「知能」

強力な計画、進捗管理、反省、記憶能力を内蔵しています。「明日の台北行きの電車の切符を予約して」といった曖昧な指示を出すと、チケット予約アプリを開き、日付と目的地を選択し、適切な列車を探し、問題が発生した場合には反省して調整するなど、自分で手順を計画します。

3. 現実世界の混乱への対処

スマートフォンやPCを操作していると、ポップアップ広告やシステム通知に邪魔されることがよくあります。Mobile-Agent-v3は、例外処理能力を特別に強化しており、これらの妨害に賢く対処し、小さなポップアップで動かなくなることなく、タスクがスムーズに進行するようにします。

4. アプリケーション間の情報伝達

重要な情報を記録する機能を備えており、異なるアプリケーション間で情報を簡単に転送できます。これは、クリップボードと短期記憶を持っているようなもので、コピー＆ペーストや情報の照合といったクロスアプリ操作を簡単に行うことができます。

オープンソースの力：誰もが参加できるAI革命

同様の技術について言及すると、AutoGLMを思い浮かべる人もいるかもしれません。Mobile-Agent-v3はいくつかの点でAutoGLMほど完成されていないという意見もありますが、オープンソースであるという大きな利点があります。

オープンソースであるということは、世界中の開発者や研究者がそのコードを閲覧し、知恵を出し合い、それを基に二次開発を行うことができるということです。これにより、技術の反復と最適化が加速されるだけでなく、より多くの人々がこの最先端技術に触れ、応用する機会を得ることができます。X-PLUGチームも、詳細な技術レポート、デモビデオ、コードリポジトリを惜しみなく提供し、コミュニティの発展を推進する決意を示しています。

まとめ：単なるツールではなく、未来の雛形

Mobile-Agent-v3の登場は、単なる強力なGUI自動化ツールではありません。それは、未来の人間とコンピュータの対話がどのようなものになるかを示す、予告編のようなものです。

Mobile-Agentのような技術が成熟し続けるにつれて、私たちのデジタルライフはより便利で効率的になるでしょう。学術界からの幅広い評価（その前身バージョンはNeurIPSやICLRなどのトップAIカンファレンスで受理されています）から、コミュニティからの熱狂的な反応まで、この道が無限の可能性に満ちていることを証明しています。

AIオートメーションやマルチモーダルモデルに興味がある方、あるいは単に未来を覗いてみたいという方は、ぜひMobile-AgentのGitHubプロジェクトを覗いてみてください。きっと目から鱗が落ちるはずです。

Featured Partners

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

SPONSORED

DMflow.chat

Discover DMflow.chat and unlock the new era of AI-powered customer service.

Learn More

SPONSORED

DMflow.chat

DMflow.chat: Your intelligent AI partner for exceptional customer engagement.

Learn More

SPONSORED

videoweaver.app

Video Weaver: Professional video editing directly in your browser. No downloads required.

Learn More

Recommended for You

A …

tutorials

AIプロンプト究極ガイド：ゼロから専門家まで、より強力なAIアプリケーションを構築する秘訣

AIの応答が期待通りではないと感じていませんか？鍵はあなたの「プロンプト」にあるかもしれません。このガイドでは、C.L.E.A.R.コア原則から4つのレベルのプロンプトテクニックまで、プロンプトエンジニアリングの芸術を深く掘り下げ、専門家のようにAIと対話する方法を教えます。アプリケーションを開発する場合でも、ワークフローを自動化する場合でも、正確で効率的な結果を得ることができます。 AI時代の新しい言語：なぜ「指示を出す」ことを学ばなければならないのか？多くの人々は、AIとの対話は検索エンジンにキーワードを入力するようなものだと考えています。いくつかの単語を入力し、最良の結果を期待します。しかし、正直なところ、AIを「かなり賢い」おもちゃから、完全なワークフローを構築し、複雑な問題を解決できる有能なアシスタントに変えたいのであれば、その言語、つまり「プロンプト」を話すことを学ぶ必要があります。これは難解な魔法ではなく、コミュニケーションの芸術です。非常に真面目だが常識に欠けるインターンに指示を出していると想像してみてください。彼があなたの意図を「推測」することを期待することはできません。タスクの背景、目標、手順、および制約をすべて明確に説明する必要があります。説明が明確であるほど、彼が提供する成果は優れています。 LovableのようなAIアプリケーション開発プラットフォームでは、プロンプトはあなたとAIの協調作業の架け橋です。優れたプロンプトは、AIがUIインターフェースを正確に生成し、バックエンドロジックを記述することを可能にします。逆に、曖昧なプロンプトは、手動で修正する必要のあるコードの山、またはまったく機能しない結果をもたらすだけです。プロンプトエンジニアリングを習得すると、どのようなメリットがありますか？反復的なタスクの自動化： AIに何をすべきかを正確に伝え、面倒な作業を処理させます。デバッグプロセスの高速化： AIが生成した分析と解決策により、問題の核心をより迅速に見つけます。ワークフローの簡単な作成と最適化：プログラミングの専門家でなくても、AIに面倒な作業を任せることができます。準備はいいですか？AIにあなたの言葉を本当に理解させる方法を見てみましょう。専門家のように考える方法とは？まずAIの「脳」を理解するテクニックを掘り下げる前に、まず確立する必要のある概念があります。大規模言語モデル（LLM）は、人間のようにあなたの言葉を「理解」しているわけではありません。膨大なトレーニングデータに基づいて、最も可能性の高い次の単語を「予測」しているのです。これは、プロンプトの構造が予測の品質に直接影響することを意味します。安定した高品質の出力を得るには、プロンプトを構造化することをお勧めします。まるで明確な青写真を与えるかのように。次の4つのタグを使用して指示を整理してみてください。背景（Context）と詳細： AIには、私たちが「常識」と呼ぶものがありません。関連するすべての背景情報を提供する必要があります。たとえば、「ログインページを作成してください」と言うだけでは不十分です。「Reactを使用してログインページを構築し、メール/パスワード検証とJWT処理機能が必要で、認証にはSupabaseを使用します」と具体的に説明する必要があります。明確な指示（Instructions）と制約（Constraints）： AIがあなたの目標を推測すると決して思い込まないでください。好みや制限がある場合は、必ず直接伝えてください。AIはあなたの指示を文字通りに実行します。曖昧な部分は、予期しない結果、さらにはAIの「幻覚」（つまり、AIが作り話した情報）につながる可能性があります。構造が重要（順序と強調）： AIモデルは、プロンプトの最初と最後に特に注意を払います。最も重要な要求を最初に置き、最後に絶対に妥協できない要件を再確認します。同時に、モデルの「コンテキストウィンドウ」は限られていることにも注意してください。長すぎる会話は、以前の内容を忘れさせる可能性があります。重要な情報を適時思い出させるのは良い習慣です。要するに、AIを、一言一句を慎重に検討するインターンだと考えてください。与える指示が明確で構造化されているほど、成果は向上します。あなたのプロンプトチェックリスト：C.L.E.A.R.フレームワーク優れたプロンプトは、通常、いくつかの簡単な原則に従います。ここでは、**C.L.E.A.R.**という覚えやすい頭字語を提供します。指示を出すときに、すべてを実行できているかどうかを確認するために使用できます。簡潔（Concise）：要点を直接述べ、無駄な言葉は省きます。余分な形容詞や曖昧な表現は、AIを混乱させるだけです。悪い例：「科学的なトピックについて何か書いてくれませんか？」良い例：「気候変動が沿岸都市に与える影響について、200語の要約を書いてください。」論理的（Logical）：複雑な要求を整理された手順に分解します。AIは、段階的な指示を理解しやすくなります。悪い例：「ユーザー登録機能を作成してから、いくつかの使用状況データを表示してください。」良い例：「ステップ1：Supabaseを使用して、メールとパスワードを含むユーザー登録フォームを実装します。ステップ2：ユーザーが正常に登録されたら、総ユーザー数の統計情報を含むダッシュボードを表示します。」明確（Explicit）：「何が欲しいか」と「何が欲しくないか」を正確に伝えます。可能であれば、形式や内容の例を提供してください。悪い例：「犬について教えてください。」（あまりにもオープンエンド）良い例：「箇条書きで、ゴールデンレトリバーに関する5つのユニークな事実を挙げてください。」適応可能（Adaptive）：最初结果が完璧でなくても、簡単に諦めないでください。プロンプトは繰り返し修正できます。不満な点について、次のプロンプトで修正を提案し、AIがより良い結果を生み出すように導くことができます。これがあなたとAIの「対話」です。例：「提供されたソリューションには認証手順がありません。コードにユーザー検証を追加してください。」反省的（Reflective）： AIとの各対話の後、少し時間を取って振り返ってください。どの質問が良い結果をもたらしましたか？どの質問がAIを誤解させましたか？この反省は、あなた自身の「プロンプトエンジニア」スキルを向上させ、将来、より正確な指示を作成するのに役立ちます。 C.L.E.A.R.原則を覚えておけば、多くの一般的なコミュニケーションの落とし穴を避けることができます。プロンプトの4つのレベル：初心者からマスターへの道効果的なプロンプトは、練習が必要なスキルです。ここでは、プロンプトの習熟度を4つのレベルに分けます。構造化された「補助輪」から高度な「メタプロンプト」まで、必要に応じて組み合わせて使用できます。レベル1：構造化された「補助輪」プロンプト（明確な形式）始めたばかりのときや、非常に複雑なタスクを処理しているときは、ラベル付きの構造化されたプロンプトを使用すると非常に役立ちます。これにより、必要なすべての情報を提供し、誤解を減らすことができます。 Lovableで有効であることが証明されている形式は次のとおりです。背景（Context）： AIに演じてもらいたい役割。（例：「あなたはLovableを使用しているシニアフルスタックエンジニアです。」）タスク（Task）：達成したい具体的な目標。（例：「ユーザーログインとリアルタイム同期機能を備えたToDoリストアプリケーションを作成します。」）ガイドライン（Guidelines）：好ましい方法またはスタイル。（例：「フロントエンドにはReactとTailwind CSSを使用し、バックエンドの検証とデータベースにはSupabaseを使用します。」）制約（Constraints）：絶対的な制限またはしてはいけないこと。（例：「有料APIは使用せず、アプリケーションはモバイルとデスクトップの両方で正常に動作する必要があります。」）この詳細な方法は、AIを段階的にガイドし、初心者や複数ステップの複雑なタスクを処理するのに非常に適しています。レベル2：会話型プロンプト（補助輪なし）熟練するにつれて、それほど堅苦しい構造は必要なくなります。同僚に仕事を頼むように、より自然な方法でAIとコミュニケーションをとることができますが、同時に明確さと完全性を維持します。例：「プロフィール写真をアップロードする機能を作成しましょう。画像アップロードフィールドと送信ボタンを含むフォームが必要です。送信後、画像はSupabaseストレージに保存され、ユーザーデータが更新されます。必要なReactコンポーネントとバックエンド関数を作成し、エラー（ファイルが大きすぎるなど）を適切に処理できるようにしてください。」

Oct 9, 2025 Read →

O …

news

OpenAI Codexが全面アップグレード：GPT-5-Codex登場、あなたのAIコーディングパートナーがやってきた！

OpenAIは2025年9月15日、Codexのメジャーアップデートを発表し、「エージェント的コーディング」に特化したGPT-5-Codexをリリースしました。これは、より速く、より信頼性が高いだけでなく、まるで本物のチームメンバーのように、使い慣れた開発環境であなたと協業し、複雑なタスクを独立して完了することさえ可能です。この記事では、このアップグレードのハイライトと、それが私たちの開発の日常をどのように変えるかについて深く掘り下げます。以前、プログラミングをしていた時、AIツールはせいぜい賢い自動補完アシスタントだったことを覚えていますか？その時代は終わるかもしれません。OpenAIは最近、衝撃的な発表を行い、GPT-5-Codexを正式にリリースしました。これは単なるマイナーアップデートではなく、あなたのAIプログラミングアシスタントが、独り立ちできる「AIコーディングパートナー」に進化したという宣言のようなものです。 Codexは今やより速く、より信頼性が高くなり、リアルタイムの協業や独立した問題解決において、想像を絶するパフォーマンスを発揮します。ターミナル、IDE、ウェブ、さらには携帯電話で開発している場合でも、シームレスに統合されます。あなたを真に理解し、共に戦えるチームメイトを迎える準備はできていますか？コードを書くだけでなく、「思考」する？GPT-5-Codexの紹介このアップグレードの核心は、全く新しいGPT-5-Codexモデルです。これは汎用版のGPT-5ではなく、「エージェント的コーディング」（agentic coding）のために深く最適化されたバージョンです。これはどういう意味でしょうか？簡単に言うと、もはや受動的にあなたの指示を待つだけではありません。GPT-5-Codexのトレーニングデータは、すべて現実世界の複雑なソフトウェアエンジニアリングタスクから来ています。例えば：ゼロから完全なプロジェクトを構築する既存のコードに新しい機能とテストを追加する問題の根本原因を見つけるためのデバッグ大規模なコードリファクタリングの実行詳細なコードレビューの実施最も印象的なのは、思考時間を動的に調整することを学習した点です。簡単なリクエストには迅速に答えを返しますが、大規模なリファクタリングのような複雑なタスクの場合、7時間以上も独立して作業し、エラーを繰り返し修正し、最終的に成功裏に納品することができます。 OpenAIのデータによると、GPT-5-CodexはSWE-bench Verifiedベンチマークで74.5%の正解率を達成し、コードリファクタリングタスクでは標準版のGPT-5よりも51.3%高いパフォーマンスを示しました。これは、生成されるコードの品質が高く、あなたの要求をよりよく理解できることを意味します。もはやコードスタイルを規定するために長々とした指示を書く必要はありません。あなたの開発環境が、その主戦場今回のOpenAIの目標は明確です：Codexをあなたの既存のワークフローに完璧に溶け込ませることです。あなたが習慣を変える必要はありません。なぜなら、それはあなたがいつも使っている場所であなたを待っているからです。全く新しいCodex CLIとIDE拡張機能 Codex CLI（コマンドラインインターフェース）はオープンソースであり、多くのコミュニティからのフィードバックを取り入れた結果、さらに強力になりました。スクリーンショットやワイヤーフレームを添付してターミナルで直接デザインを伝えることができ、あなたのアイデアを正確に理解させることができます。そして、新しいCodex IDE拡張機能は開発者にとって大きな恩恵です。VS CodeやCursorなどのエディタにCodexの能力を直接もたらします。開いているファイルや選択したコードをコンテキストとして読み取ることができるため、より短いプロンプトでより速い結果を得ることができます。IDE内で直接クラウドタスクを作成、追跡、レビューすることさえ可能で、ウィンドウを切り替える必要は全くありません。よりスマートなクラウド協業とコードレビュー Codex Cloudでは、インフラのパフォーマンスも大幅に向上し、新しいタスクの完了時間が90%短縮されました。今では環境を自動的にスキャンして設定し、必要に応じて依存パッケージをインストールすることさえできます。最もクールなのは、GitHubのコードレビューでのパフォーマンスです。有効にすると、Codexはあなたのプルリクエスト（PR）を自動的にレビューします。静的分析ツールのようにコードをスキャンするだけでなく、PRの意図を理解し、リポジトリ全体の依存関係を分析し、さらにはコードとテストを実行して動作を検証します。 OpenAIの内部統計によると、GPT-5-Codexが提出した誤ったコメントは減少し、価値のある「ハイインパクト」なコメントは増加しました。これは、チームが問題をより早期に発見し、レビュー担当者の負担を軽減し、より自信を持って製品をリリースできることを意味します。セキュリティ、それがすべての基盤もちろん、AIにこれほど大きな権限を与える以上、セキュリティは最優先事項です。OpenAIはこの分野でも多くの努力をしています。デフォルトでは、ローカルでもクラウドでも、Codexはサンドボックス環境で実行され、ネットワークアクセスは無効になっています。これにより、あなたのコンピュータに害を及ぼしたり、出所不明のコマンドに影響されたりするのを効果的に防ぎます。同時に、潜在的に危険な操作を実行する前に許可を求めます。開発者は、クラウドで信頼できるドメインへのアクセスのみを許可したり、CLIやIDEでコマンドを手動で承認したりするなど、セキュリティ設定をカスタマイズできます。これらはすべて、AIの能力を拡張すると同時に、プロセス全体が安全で制御可能であることを保証するためです。どうやって始める？価格と利用可能性良いニュースは、CodexがすでにChatGPT Plus、Pro、Business、Edu、およびEnterpriseプランに含まれていることです。プランによって使用制限は異なり、週に数回の集中コーディングセッションから、週全体の複数プロジェクト開発をサポートするものまであります。 API経由での使用を希望する開発者向けに、OpenAIはGPT-5-Codexを間もなく公開する予定です。結論：新時代の幕開け単純なコードの自動補完から、独立して思考し、自律的にタスクを実行できるこのAIコーディングパートナーまで、Codexの進化は驚異的です。もはや単なるツールではなく、イノベーションを加速し、品質を向上させる「チームメイト」です。 Cisco MerakiのテクニカルリードであるTres Wong-Godfrey氏が言うように、「私は別のチームが担当しているライブラリを更新する必要がありました…Codexを使えば、リファクタリングとテスト生成の作業を任せつつ、他の優先事項に集中できました。高品質で完全にテストされたコードを生成し、機能は予定通りに、リスクを増やすことなく本番環境に投入されました。」あなたはこのAIパートナーを迎え入れ、さらに壮大なプロジェクトに共に挑戦する準備ができていますか？より技術的な詳細については、OpenAIの公式発表記事をご覧ください。

Sep 16, 2025 Read →

A …

tool

AIエージェントの混乱にさよなら！AGENTS.mdが開発ワークフローを統一する方法

AIプログラミングツールごとに指示をカスタマイズするのにうんざりしていませんか？OpenAIやGoogleなどの巨人が共同で立ち上げたオープンスタンダード、AGENTS.mdをご紹介します。1つのファイルですべてのAIエージェントを指揮し、開発効率を大幅に向上させます。こんな状況に陥ったことはありませんか？今日はGitHub Copilotを使い、明日はCursorを試し、明後日にはGoogleの新しいツールを開いているかもしれません。どのAIプログラミングエージェントも強力ですが、まるで違う国から来た同僚のようです。ツールごとに異なるプロジェクトの背景や指示を提供するために、常に「言語」を切り替えなければなりません。率直に言って、これは本当に疲れます。詳細なREADME.mdファイルを書くのに時間を費やしても、AIは要点を掴めず、手動でたくさんの設定コマンドを与える必要があります。すべてのAIエージェントが一目見て理解できる、共通の「取扱説明書」があれば、どれほど素晴らしいことでしょう？良い知らせです。その願いが今、現実になりました。 AGENTS.mdとは？AIのために作られた「プロジェクト取扱説明書」簡単に言うと、AGENTS.mdは、AIプログラミングエージェントにプロジェクトでの作業方法を指示するために特別に設計された、オープンでベンダーニュートラルな標準です。**「AIのために作られたREADME」**と考えることができます。この標準は、決して小さな試みではありません。OpenAIのCodex、GoogleのJules、Cursor、Ampなど、業界の重鎮たちが背後にいます。彼らは皆で集まり、現在のAI協業における混乱を解決するために、統一されたコミュニケーション方法を確立することを決定しました。これまで、私たちのREADME.mdは「人間」向けに書かれており、プロジェクトの理念、インストール手順、いくつかの基本的な使い方などが含まれていました。しかし、AIにとって、この情報はあまりにも曖昧です。AIが必要とするのは、より正確で実行可能な指示です。AGENTS.mdは、まさにそのために生まれました。プロジェクトの重要な情報やワークフローを、AIが理解できる方法で書き留めるための、固定的で予測可能な場所を提供します。 1つのファイルですべてのAIを管理？最高じゃないか！その通りです。これこそがAGENTS.mdの最大の魅力です。想像してみてください。プロジェクトのルートディレクトリにAGENTS.mdファイルを作成し、開発環境の設定のヒント、テストの実行方法、PR提出のフォーマット要件などを詳細に書き留めるだけです。その後、この標準をサポートするどのAIエージェントを使用しても、エージェントはこのファイルを自動的に読み込み、すぐにベテランのチームメンバーのように作業を開始します。プラットフォームごとに設定を繰り返す必要も、AIがプロジェクトの仕様に不慣れなために「善意で悪いことをする」心配ももうありません。これは、多くの時間と労力を節約するだけでなく、AIを開発ワークフローによりスムーズに統合することも可能にします。理論だけじゃない、実践例を見てみよう百聞は一見に如かず。AGENTS.mdのサンプルファイルを分解して、実際にどれほど実用的か見てみましょう。 # サンプルAGENTS.mdファイル ## 開発環境のヒント - `ls`でゆっくり探すのではなく、`pnpm dlx turbo run where <project_name>`を使って特定のパッケージにジャンプします。 - `pnpm install --filter <project_name>`を実行してパッケージをインストールすると、Vite、ESLint、TypeScriptが正しく認識します。 - `pnpm create vite@latest <project_name> -- --template react-ts`を使って、新しいReact + Vite + TypeScriptプロジェクトを素早く作成します。 - 各パッケージの`package.json`のnameフィールドをチェックして正しい名前を確認し、最上位のものは無視します。 ## テストガイド - CI計画は`.github/workflows`フォルダで設定されています。 - `pnpm turbo run test --filter <project_name>`を実行して、そのパッケージのすべてのチェックを実行します。 - パッケージのルートディレクトリでは、`pnpm test`を直接使用することもできます。マージする前にすべてのテストがパスすることを確認してください。 - 単一のテストのみを実行したい場合は、Vitestのパターンを追加できます：`pnpm vitest run -t "<test name>"`。 - テストスイート全体がグリーンになるまで、すべてのテストまたは型エラーを修正します。 - ファイルを移動したり、インポートを変更したりした後は、`pnpm lint --filter <project_name>`を実行して、ESLintとTypeScriptのルールがまだパスすることを確認することを忘れないでください。 - 誰も頼まなくても、変更したコードのテストを追加または更新してください。 ## PR提出ガイドライン - タイトル形式：[<project_name>] <タイトル> - 提出前に必ず`pnpm lint`と`pnpm test`を実行してください。ご覧の通り、このドキュメントは非常に明確に書かれています。

Aug 20, 2025 Read →