Project Fetchとは — AIによるロボット自律制御の実験
Project Fetch — Phase 1 から Phase 2 への進展
Project Fetch は、Anthropic の Frontier Red Team(安全性研究チーム)が実施しているロボット自律制御の実験です。市販のロボット犬(四足歩行ロボット)を用い、AIモデルが人間の助けなしにロボットを操作できるかを段階的に測定しています。
この実験はマーケティング目的ではなく、AIの能力と限界を安全面から評価するレッドチームの取り組みとして設計されています。成功を宣伝するのではなく、失敗を含めた能力の実態を明らかにすることが目的です。
Phase 1(2025年)— AIは補助役にとどまった
2025年8月に実施されたPhase 1では、当時のモデルであるClaude Opus 4.1が使われました。結果は明確で、Opus 4.1は単独ではタスクを完了できませんでした。ロボットへの接続という最初の段階で行き詰まったためです。
Unquestionably, it could not. Much like our team without Claude, it got hung up on the preliminary task of figuring out how to connect to the robot. — Phase 1 の結果に関する説明より
一方で、人間のチームがClaude Opus 4.1を補助ツールとして使った場合には、AIなしのチームを大きく上回る成果が出ました。Phase 1の段階では、Claudeは優秀な「補助役」であっても、自律的に動ける「操作者」ではなかった。
Phase 2(2026年)— Opus 4.7が完全自律でロボットを操作
2026年6月18日に公開されたPhase 2では、状況が劇的に変わりました。Claude Opus 4.7が、Claude Codeを通じてロボット犬を自律的に操作し、7つのタスクのうち大半を人間の介入なしに完了しています。
実験で使われたのは市販のロボット犬で、メーカー提供のコントローラー、ビデオカメラ、LiDARセンサーを搭載しています。研究者の役割は、ノートパソコンの接続、初期プロンプトの入力、コマンドの承認に限られていました。
The role of our researcher was limited to plugging a laptop running Claude Code into the robodog, entering the initial prompt, approving commands, and approving the model to go to the next task. — 実験条件の説明より
Phase 1で接続段階すら突破できなかったモデルの後継が、わずか10ヶ月後にはセンサー接続からプログラム作成、物体検出まで自力でこなすようになった。 モデルの世代間進化の速さを如実に表しています。
実験結果の数値データ — 速度・コード効率・成否
4タスク共通比較 — 完了時間(分)
棒の長さは完了時間に比例。数値は Anthropic Research 公開値。短いほど高速。
Phase 2では、7つのタスクが設定されました。ロボットのコントローラー操作、ビデオセンサーとLiDARセンサーへの接続、手動制御プログラムの作成と実行、経路の監視、ビーチボールの検出、そしてビーチボールの自律回収です。全参加者が挑戦した4タスクの共通比較と、コード効率、失敗した部分を順に整理します。
人間チームの約20倍速で完了(9分35秒 vs 181分)
全参加者が完了した4つのタスクでの比較が、この実験の核となるデータです。AIなしの人間チームは361分、AI補助の人間チームは181分を要しました。これに対し、Opus 4.7は9分35秒で同じタスクを完了しています。
Claude Opus 4.7—operating without human assistance—was about 20 times faster than the fastest human team at all tasks completed by participants less than a year ago. — 速度比較の結論より
倍率に換算すると、AIなしチームに対しては約37.7倍、AI補助チームに対しては約18.9倍です。5つのタスクまで範囲を広げた比較でも、AI補助チームの264分に対してOpus 4.7は12分7秒で、同様の大差が確認されています。
全タスクで人間チームの少なくとも10倍以上の速度。特定のタスクだけが速かったのではなく、全体的に桁違いの速度差があった。
| 比較対象 | 4タスク完了時間 | Opus 4.7との速度比 |
|---|---|---|
| AIなしチーム | 361分 | 約37.7倍遅い |
| AI補助チーム | 181分 | 約18.9倍遅い |
| Opus 4.7(自律) | 9分35秒 | — |
3回の試行を通じて、Opus 4.7のタスク内ばらつきは小さく、コードは大半が初回で正しく動作したとされています。
コード量は人間の10分の1(1,045行 vs 10,309行)
速度だけでなく、生成されたコードの量にも大きな差がありました。
it was as or more successful than both human teams while producing almost ten times less code than Team Claude. — コード効率に関する説明より
| チーム | コード行数 |
|---|---|
| AI補助チーム | 10,309行 |
| AIなしチーム | 1,136行 |
| Opus 4.7 | 1,045行 |
興味深いのは、AIなしチームのコード量(1,136行)とOpus 4.7のコード量(1,045行)がほぼ同じ点です。AI補助チームはClaudeの提案を取り込みながらコードを膨らませた一方で、Opus 4.7は単独で必要十分なコードを書いた。コード量が少ないこと自体が品質を意味するわけではないものの、冗長なコードを積み上げずに同等以上の成果を出した点は、AIのコード生成効率を測る具体的な材料になります。
ビーチボール回収は未達成 — 閉ループ制御の壁
実験の最終タスクは、ビーチボールを検出し、スタート地点の人工芝まで自律的に回収することでした。このタスクは完全には達成されていません。
Opus 4.7はセンサー接続、ボールの検出、ロボットの位置決め(ボールの背後に回り込む動き)まではこなしました。しかし、ボールを正確に動かす段階で制御が不安定になっています。
But the efforts to do so were poorly controlled and (again, like our human participants) not successful. — ビーチボール回収タスクの結果より
この失敗の要因は、閉ループ制御(リアルタイムで視覚フィードバックを受け取りながら運動を調整する制御方式)の難しさにあります。センサー情報に基づいて判断し、コードを生成する「開ループ」の作業には長けていても、物理世界での微細な調整を連続的に行う制御は、現在のLLM(大規模言語モデル)にとって未解決の課題です。
なお、ロボティクス経験のある人間が追加の仕組み(スキャフォールディング)を加えることで、このタスクを達成できたとの記述もあります。完全に不可能な課題ではなく、AIだけでは足りない部分を人間が補えば実現可能なレベルにあるといえます。
AIロボティクスの可能性と限界
Opus 4.7がロボット制御で「できたこと」と「できなかったこと」
Project Fetch Phase 2の結果は、AIの現在位置を実測値で示した実験です。ソフトウェア側のタスク(接続、プログラム作成、データ処理)では圧倒的な速度を発揮する一方で、物理世界の連続的な制御には壁が残っています。何が得意で何がまだ難しいのか、以降で整理します。
ロボティクス専用訓練なしで制御できた意味
この実験で重要なのは、Opus 4.7がロボティクス専用のファインチューニングを受けていない点です。ロボット制御向けのデータセットで追加学習をしたわけではなく、汎用モデルとしての性能向上がそのまま物理的なタスクにも転移しました。
It is worth underscoring (as we did in our previous post) that this progress is not the result of a concerted effort to improve the robotics capabilities of our models. These improvements, like so many others in the history of LLM development, have emerged from much more general scaling. — 汎用性に関する説明より
この結果は、AIモデルの汎用能力が一定の閾値を超えると、専用の訓練をしなくても新しい領域に対応できるようになることを裏付けています。 ロボティクスに限らず、製造設備の操作、IoTデバイスの管理、物理的なツールの遠隔制御といった分野にも、同じ原理が適用される可能性があります。
Opus 4.7は人間が迷いやすい判断(センサーとのインターフェース方式の選定など)を素早くこなし、書いたコードの大半が初回で動作したとされています。プログラミングが「書く→実行→結果を見る→修正する」という高速なフィードバックループを持つタスクであることが、AIの得意領域と合致しています。
リアルタイムフィードバック制御の課題
一方で、ビーチボール回収の失敗が浮き彫りにしたのは、現在のLLMが苦手とする領域の輪郭です。低レベルのロボット制御、つまり「特定のアクチュエーション方策(モーターの動かし方の具体的な計画)を策定する」ようなタスクは、まだLLMの能力範囲にないとされています。
プログラミングでは、コードを書いて実行結果を確認し、修正するというサイクルが明確に分かれています。しかしロボット制御では、視覚情報を受け取りながら同時にモーターを調整する連続的な処理が必要です。この「見ながら動かす」というリアルタイムのフィードバック処理が、テキストベースで逐次的に思考するLLMにとって構造的に難しい。
ただし、この実験では「LLMがロボティクスを解決した」とも「解決できない」とも結論づけていません。人間の補助やスキャフォールディングを加えればビーチボール回収も達成可能であったことから、AIと人間の協働による段階的な自動化が、現実的な進展の方向性として浮かび上がっています。
実務への影響と今後の展望
Project Fetchの結果を実務の視点から見ると、実務に関係する点が2つあります。
we now seem much closer to a world where models will be able to use off-the-shelf physical tools with relative ease — 実験全体の考察より
ひとつは、AIモデルの世代間進化の速度です。Phase 1(2025年8月)でロボットへの接続すらできなかったモデルが、Phase 2(2026年6月)では自律操作を20倍速で完了するまでになりました。この10ヶ月間の進歩は、ロボティクス固有の訓練ではなく汎用モデルの性能向上から来ているため、次世代モデルではさらに複雑な物理タスクに対応する可能性があります。
もうひとつは、市販ハードウェアとの組み合わせの容易さです。特注のロボットではなく市販のロボット犬を使い、専用のドライバーやミドルウェアを開発することなくAIが操作できた点は、産業用途での導入障壁を下げる方向に作用します。
実際にClaude Codeを業務で使い込んでいる立場から見ると、コード生成の速さと初回精度の高さは、日常の肌感覚と一致します。 物理世界の制御にまでその能力が広がりつつあるという実験結果は、AIを業務に組み込む範囲がソフトウェアの枠を超え始めていることを具体的に示しています。
まとめ — Project Fetchが示すAIロボティクスの現在地
Project Fetch Phase 2は、AIの自律制御能力の現在地を数値で示した実験です。Claude Opus 4.7は市販のロボット犬を人間の約20倍の速度で操作し、コード量は10分の1に抑えました。一方で、ビーチボールの正確な回収という物理的な精密制御には至っていません。
この実験が示しているのは、「AIがロボットを完全に置き換える」段階ではなく、「AIがソフトウェア側のタスクを圧倒的に加速できる」段階にあるということです。物理世界の連続的な制御は依然として人間の領域ですが、次の世代で境界がどこまで動くかは読めません。
実験の詳細な手法やデータはAnthropicのResearchページで確認できます。
AIの最新動向を調べる際は、公式ページの情報をMarkdown形式に整えてから読み込むと、見出しや表の構造が保たれて効率が上がります。