ファナック、模倣学習を60時間→4.8時間に短縮 AWSのGPUクラウドで実現

ファナックがAWS EC2 P5 GPUを活用し、ロボット模倣学習の所要時間を60時間から4.8時間へ約92%削減した
視覚言語行動（VLA）モデルにより、衣類など柔らかい素材のハンドリングもルールなしで習得可能になった
仮想空間データと実機データの併用により、NVIDIAやGoogleとの協業でフィジカルAIの実用化を加速している

60時間を4.8時間に短縮した実績

産業用ロボットの大手メーカー、ファナックは2026年6月に開催された「AWS Summit Japan 2026」において、クラウドGPUを活用したロボット模倣学習の高速化事例を公表しました。自社オンプレミスのGPUサーバーでは1つの動作を学習させるのに約60時間かかっていた処理が、AWSのGPUインスタンス「Amazon EC2 P5」を活用することで4.8時間まで短縮されました。削減率は約92%です。

60時間という数値を具体的にとらえると、GPUサーバーが24時間稼働し続けても2日半以上の計算待ちが生じていたことになります。新しい動作パターンをロボットに追加するたびにこの待ち時間が発生していたため、現場への改良反映や新作業への対応は大幅に遅れていました。クラウドGPUへの切り替えによってこの制約が解消されます。

模倣学習とVLAモデルの仕組み

今回高速化の対象となった「模倣学習」とは、人間が実際に作業する様子をロボットに見せ、その動作パターンをAIに学習させる手法です。ファナックはこれを「視覚言語行動（VLA: Vision-Language-Action）モデル」と組み合わせて活用しています。VLAモデルはカメラ映像や言語指示などの複数情報を統合してロボットの動作を生成するAIモデルで、事前に細かいルールを定義しなくても複雑な作業を習得できる点が特徴です。

特に課題だったのが、衣類のような柔らかい素材の取り扱いです。形状が随時変わる素材はルールベースの制御では対応が難しく、自動化から取り残されやすい作業領域でした。VLAモデルによる模倣学習を使えば、こうした不定形の物体を扱う動作もロボットが習得できるようになります。

クラウドGPUが開く開発サイクル

ファナックは実機でのデータ収集に加え、仮想空間（シミュレーション）での並列学習を組み合わせる手法を採用しています。実機を長時間動かすコストや準備の手間を抑えながら大量の学習データを生成し、それをクラウドGPUで一括処理する流れです。AWSのEC2 P5インスタンスはNVIDIA H100 GPUを搭載しており、VLAモデルの学習に必要な大規模な並列計算に対応しています。

学習時間が約12分の1になることは、試行錯誤のサイクルを大幅に速めます。動作精度が不十分だった場合の再学習や、新製品への対応のための動作パターン追加が、数日かかっていたものから半日以内で完結するようになります。

フィジカルAIの産業応用へ

ファナックは同社発表によると世界で120万台を超えるロボットを稼働させており、NVIDIAやGoogleとも協業しながらフィジカルAIの社会実装を進めています。チャット型AIや大規模言語モデル（LLM）が注目を集めるなか、物理世界で動くロボットや製造設備に特化した「フィジカルAI」の実用化は、製造現場の課題解決に直結する動向として重要度を増しています。

日本では労働人口の減少が製造業の構造的な課題となっており、ファナックはこの問題へのアプローチとしてフィジカルAIを位置づけています。製造現場へのAI導入では技術の精度だけでなく現場ノウハウの継承が鍵になることは、ほかの業界事例も示すとおりです。クラウドGPUの活用で設備投資を抑えながら高速な学習を実現できるため、大手だけでなく中小規模の製造業者にも導入の選択肢が広がる可能性があります。