sakutto
生成AI· Claude Opus 4.7

Project Fetchとは?Claude Opus 4.7がロボットを人間の20倍速で制御した実験を解説

ClaudeAnthropicProject Fetchロボティクス

Project Fetchとは — AIによるロボット自律制御の実験

Project Fetch — Phase 1 から Phase 2 への進展

Phase 1 2025年8月 — Opus 4.1はロボットへの接続で詰まり、単独操作に失敗
Phase 2 2026年6月 — Opus 4.7が自律で接続・制御・検出まで完了(人間の約20倍速)

Project Fetch は、Anthropic の Frontier Red Team(安全性研究チーム)が実施しているロボット自律制御の実験です。市販のロボット犬(四足歩行ロボット)を用い、AIモデルが人間の助けなしにロボットを操作できるかを段階的に測定しています。

この実験はマーケティング目的ではなく、AIの能力と限界を安全面から評価するレッドチームの取り組みとして設計されています。成功を宣伝するのではなく、失敗を含めた能力の実態を明らかにすることが目的です。

Phase 1(2025年)— AIは補助役にとどまった

2025年8月に実施されたPhase 1では、当時のモデルであるClaude Opus 4.1が使われました。結果は明確で、Opus 4.1は単独ではタスクを完了できませんでした。ロボットへの接続という最初の段階で行き詰まったためです。

公式情報を見る →
Unquestionably, it could not. Much like our team without Claude, it got hung up on the preliminary task of figuring out how to connect to the robot. — Phase 1 の結果に関する説明より

一方で、人間のチームがClaude Opus 4.1を補助ツールとして使った場合には、AIなしのチームを大きく上回る成果が出ました。Phase 1の段階では、Claudeは優秀な「補助役」であっても、自律的に動ける「操作者」ではなかった。

Phase 2(2026年)— Opus 4.7が完全自律でロボットを操作

2026年6月18日に公開されたPhase 2では、状況が劇的に変わりました。Claude Opus 4.7が、Claude Codeを通じてロボット犬を自律的に操作し、7つのタスクのうち大半を人間の介入なしに完了しています。

実験で使われたのは市販のロボット犬で、メーカー提供のコントローラー、ビデオカメラ、LiDARセンサーを搭載しています。研究者の役割は、ノートパソコンの接続、初期プロンプトの入力、コマンドの承認に限られていました。

公式情報を見る →
The role of our researcher was limited to plugging a laptop running Claude Code into the robodog, entering the initial prompt, approving commands, and approving the model to go to the next task. — 実験条件の説明より

Phase 1で接続段階すら突破できなかったモデルの後継が、わずか10ヶ月後にはセンサー接続からプログラム作成、物体検出まで自力でこなすようになった。 モデルの世代間進化の速さを如実に表しています。

実験結果の数値データ — 速度・コード効率・成否

4タスク共通比較 — 完了時間(分)

棒の長さは完了時間に比例。数値は Anthropic Research 公開値。短いほど高速。

AIなしチーム361分
AI補助チーム181分
Opus 4.7(自律)9.6分

Phase 2では、7つのタスクが設定されました。ロボットのコントローラー操作、ビデオセンサーとLiDARセンサーへの接続、手動制御プログラムの作成と実行、経路の監視、ビーチボールの検出、そしてビーチボールの自律回収です。全参加者が挑戦した4タスクの共通比較と、コード効率、失敗した部分を順に整理します。

人間チームの約20倍速で完了(9分35秒 vs 181分)

全参加者が完了した4つのタスクでの比較が、この実験の核となるデータです。AIなしの人間チームは361分、AI補助の人間チームは181分を要しました。これに対し、Opus 4.7は9分35秒で同じタスクを完了しています。

公式情報を見る →
Claude Opus 4.7—operating without human assistance—was about 20 times faster than the fastest human team at all tasks completed by participants less than a year ago. — 速度比較の結論より

倍率に換算すると、AIなしチームに対しては約37.7倍、AI補助チームに対しては約18.9倍です。5つのタスクまで範囲を広げた比較でも、AI補助チームの264分に対してOpus 4.7は12分7秒で、同様の大差が確認されています。

全タスクで人間チームの少なくとも10倍以上の速度。特定のタスクだけが速かったのではなく、全体的に桁違いの速度差があった。

比較対象4タスク完了時間Opus 4.7との速度比
AIなしチーム361分約37.7倍遅い
AI補助チーム181分約18.9倍遅い
Opus 4.7(自律)9分35秒

3回の試行を通じて、Opus 4.7のタスク内ばらつきは小さく、コードは大半が初回で正しく動作したとされています。

コード量は人間の10分の1(1,045行 vs 10,309行)

速度だけでなく、生成されたコードの量にも大きな差がありました。

公式情報を見る →
it was as or more successful than both human teams while producing almost ten times less code than Team Claude. — コード効率に関する説明より
チームコード行数
AI補助チーム10,309行
AIなしチーム1,136行
Opus 4.71,045行

興味深いのは、AIなしチームのコード量(1,136行)とOpus 4.7のコード量(1,045行)がほぼ同じ点です。AI補助チームはClaudeの提案を取り込みながらコードを膨らませた一方で、Opus 4.7は単独で必要十分なコードを書いた。コード量が少ないこと自体が品質を意味するわけではないものの、冗長なコードを積み上げずに同等以上の成果を出した点は、AIのコード生成効率を測る具体的な材料になります。

ビーチボール回収は未達成 — 閉ループ制御の壁

実験の最終タスクは、ビーチボールを検出し、スタート地点の人工芝まで自律的に回収することでした。このタスクは完全には達成されていません。

Opus 4.7はセンサー接続、ボールの検出、ロボットの位置決め(ボールの背後に回り込む動き)まではこなしました。しかし、ボールを正確に動かす段階で制御が不安定になっています。

公式情報を見る →
But the efforts to do so were poorly controlled and (again, like our human participants) not successful. — ビーチボール回収タスクの結果より

この失敗の要因は、閉ループ制御(リアルタイムで視覚フィードバックを受け取りながら運動を調整する制御方式)の難しさにあります。センサー情報に基づいて判断し、コードを生成する「開ループ」の作業には長けていても、物理世界での微細な調整を連続的に行う制御は、現在のLLM(大規模言語モデル)にとって未解決の課題です。

なお、ロボティクス経験のある人間が追加の仕組み(スキャフォールディング)を加えることで、このタスクを達成できたとの記述もあります。完全に不可能な課題ではなく、AIだけでは足りない部分を人間が補えば実現可能なレベルにあるといえます。

AIロボティクスの可能性と限界

Opus 4.7がロボット制御で「できたこと」と「できなかったこと」

メーカーコントローラー経由でのロボット操作
ビデオセンサー・LiDARセンサーへの接続
手動制御プログラムの作成と実行
ロボットの経路監視
ビーチボールの検出と位置決め
ビーチボールの正確な回収(閉ループ制御)
リアルタイムのフィードバックに基づく精密な運動調整

Project Fetch Phase 2の結果は、AIの現在位置を実測値で示した実験です。ソフトウェア側のタスク(接続、プログラム作成、データ処理)では圧倒的な速度を発揮する一方で、物理世界の連続的な制御には壁が残っています。何が得意で何がまだ難しいのか、以降で整理します。

ロボティクス専用訓練なしで制御できた意味

この実験で重要なのは、Opus 4.7がロボティクス専用のファインチューニングを受けていない点です。ロボット制御向けのデータセットで追加学習をしたわけではなく、汎用モデルとしての性能向上がそのまま物理的なタスクにも転移しました。

公式情報を見る →
It is worth underscoring (as we did in our previous post) that this progress is not the result of a concerted effort to improve the robotics capabilities of our models. These improvements, like so many others in the history of LLM development, have emerged from much more general scaling. — 汎用性に関する説明より

この結果は、AIモデルの汎用能力が一定の閾値を超えると、専用の訓練をしなくても新しい領域に対応できるようになることを裏付けています。 ロボティクスに限らず、製造設備の操作、IoTデバイスの管理、物理的なツールの遠隔制御といった分野にも、同じ原理が適用される可能性があります。

Opus 4.7は人間が迷いやすい判断(センサーとのインターフェース方式の選定など)を素早くこなし、書いたコードの大半が初回で動作したとされています。プログラミングが「書く→実行→結果を見る→修正する」という高速なフィードバックループを持つタスクであることが、AIの得意領域と合致しています。

リアルタイムフィードバック制御の課題

一方で、ビーチボール回収の失敗が浮き彫りにしたのは、現在のLLMが苦手とする領域の輪郭です。低レベルのロボット制御、つまり「特定のアクチュエーション方策(モーターの動かし方の具体的な計画)を策定する」ようなタスクは、まだLLMの能力範囲にないとされています。

プログラミングでは、コードを書いて実行結果を確認し、修正するというサイクルが明確に分かれています。しかしロボット制御では、視覚情報を受け取りながら同時にモーターを調整する連続的な処理が必要です。この「見ながら動かす」というリアルタイムのフィードバック処理が、テキストベースで逐次的に思考するLLMにとって構造的に難しい。

ただし、この実験では「LLMがロボティクスを解決した」とも「解決できない」とも結論づけていません。人間の補助やスキャフォールディングを加えればビーチボール回収も達成可能であったことから、AIと人間の協働による段階的な自動化が、現実的な進展の方向性として浮かび上がっています。

実務への影響と今後の展望

Project Fetchの結果を実務の視点から見ると、実務に関係する点が2つあります。

公式情報を見る →
we now seem much closer to a world where models will be able to use off-the-shelf physical tools with relative ease — 実験全体の考察より

ひとつは、AIモデルの世代間進化の速度です。Phase 1(2025年8月)でロボットへの接続すらできなかったモデルが、Phase 2(2026年6月)では自律操作を20倍速で完了するまでになりました。この10ヶ月間の進歩は、ロボティクス固有の訓練ではなく汎用モデルの性能向上から来ているため、次世代モデルではさらに複雑な物理タスクに対応する可能性があります。

もうひとつは、市販ハードウェアとの組み合わせの容易さです。特注のロボットではなく市販のロボット犬を使い、専用のドライバーやミドルウェアを開発することなくAIが操作できた点は、産業用途での導入障壁を下げる方向に作用します。

実際にClaude Codeを業務で使い込んでいる立場から見ると、コード生成の速さと初回精度の高さは、日常の肌感覚と一致します。 物理世界の制御にまでその能力が広がりつつあるという実験結果は、AIを業務に組み込む範囲がソフトウェアの枠を超え始めていることを具体的に示しています。

まとめ — Project Fetchが示すAIロボティクスの現在地

Project Fetch Phase 2は、AIの自律制御能力の現在地を数値で示した実験です。Claude Opus 4.7は市販のロボット犬を人間の約20倍の速度で操作し、コード量は10分の1に抑えました。一方で、ビーチボールの正確な回収という物理的な精密制御には至っていません。

この実験が示しているのは、「AIがロボットを完全に置き換える」段階ではなく、「AIがソフトウェア側のタスクを圧倒的に加速できる」段階にあるということです。物理世界の連続的な制御は依然として人間の領域ですが、次の世代で境界がどこまで動くかは読めません。

実験の詳細な手法やデータはAnthropicのResearchページで確認できます。

Anthropic Research — Project Fetch: Phase two(公式)公式情報を見る →

AIの最新動向を調べる際は、公式ページの情報をMarkdown形式に整えてから読み込むと、見出しや表の構造が保たれて効率が上がります。

無料ツールURLマークダウン変換URL(ウェブページ)を入力するだけでマークダウン(Markdown)に変換。見出し・表・リスト・リンクを保持したままmd化でき、LLMやRAGの前処理、調査資料の整形にも最適な無料オンラインツール。今すぐ使ってみる →

よくある質問

Q. Project Fetchとは何ですか?
Anthropicが実施している、Claude(AIモデル)が市販のロボット犬を自律的に操作できるかを測定する実験です。2025年8月のPhase 1と2026年6月のPhase 2があり、Phase 2ではClaude Opus 4.7が人間チームの約20倍の速度でタスクを完了しました。
Claude Opus 4.7—operating without human assistance—was about 20 times faster than the fastest human team Anthropic Research — Project Fetch: Phase two
Q. Project Fetchで使われたロボットは何ですか?
市販のロボット犬(四足歩行ロボット)で、メーカー提供のコントローラー、ビデオカメラ、LiDARセンサーを搭載しています。実験では特定のロボティクス用訓練を施していない汎用AIモデルが、このロボットを操作しました。
an off-the-shelf robotic quadruped Anthropic Research — Project Fetch: Phase two
Q. Opus 4.7はどのくらい速かったのですか?
4つの共通タスクで、AIなしチーム(361分)の約37.7倍、AI補助チーム(181分)の約18.9倍にあたる9分35秒で完了しました。すべてのタスクで人間チームの少なくとも10倍以上の速度です。
Very simply: on every task that was completed by at least one human team in August, Opus 4.7 completed the same task at least ten times faster. Anthropic Research — Project Fetch: Phase two
Q. Opus 4.7のコード量はどのくらいでしたか?
Opus 4.7が書いたコードは1,045行で、AI補助チームの10,309行と比べて約10分の1の量でした。少ないコードで同等以上の成果を達成しています。
it was as or more successful than both human teams while producing almost ten times less code than Team Claude. Anthropic Research — Project Fetch: Phase two
Q. ビーチボールの回収は成功しましたか?
完全な成功には至っていません。ボールの検出や自身の位置決めはできたものの、ボールを正確に動かす閉ループ制御は困難でした。一方、ロボティクス経験のある人間が追加の足場を組めば達成できたとの記述があります。
But the efforts to do so were poorly controlled and (again, like our human participants) not successful. Anthropic Research — Project Fetch: Phase two
Q. Phase 1からどのくらい進歩しましたか?
Phase 1(2025年8月)ではClaude Opus 4.1がロボットへの接続段階で詰まり、単独ではタスクを完了できませんでした。Phase 2のOpus 4.7は接続から制御プログラムの作成、センサー読み取りまで自律的にこなし、実質的にゼロからの自律操作を実現しています。
Unquestionably, it could not. Much like our team without Claude, it got hung up on the preliminary task of figuring out how to connect to the robot. Anthropic Research — Project Fetch: Phase two
Q. Opus 4.7はロボティクス専用に訓練されたのですか?
いいえ。Opus 4.7はロボティクス専用のファインチューニングを受けておらず、汎用モデルの性能向上がそのままロボット操作にも転移した結果です。
These improvements, like so many others in the history of LLM development, have emerged from much more general scaling. Anthropic Research — Project Fetch: Phase two
Q. 実験中の人間の役割は何でしたか?
研究者の役割は、ノートパソコンの接続、初期プロンプトの入力、コマンドの承認、次のタスクへの進行承認に限られていました。ロボットの操作やコードの修正には関与していません。
The role of our researcher was limited to plugging a laptop running Claude Code into the robodog, entering the initial prompt, approving commands, and approving the model to go to the next task. Anthropic Research — Project Fetch: Phase two
Q. この実験の結果はAI業界にどんな意味がありますか?
汎用AIが市販のハードウェアを比較的簡単に扱える世界に近づいていることを示しています。ソフトウェア開発の自動化が物理的なツール操作にも広がりつつある兆候として、ロボティクスやIoT分野への影響が注目されます。
we now seem much closer to a world where models will be able to use off-the-shelf physical tools with relative ease Anthropic Research — Project Fetch: Phase two

関連ツール

関連ツールカテゴリ

記事