- 川崎重工・ファナック・安川電機の3社が経産省GENIACに採択され、製造現場向けVTLAモデルのデータセットを2026年8月〜2027年7月に共同構築
- VTLAは視覚・触覚・言語・動作を統合したロボット向けAIモデルで、繊細な手先作業の自動化を主な目標とする
- 大阪大学・FingerVisionが参画する産学連携体制で、製造現場データをもとにエコシステム整備も並行して進める
国内ロボット大手3社がGENIACに採択
川崎重工業、ファナック、安川電機の国内ロボット大手3社が、経済産業省の推進するAI開発支援プロジェクト「GENIAC(Generative AI Accelerator Challenge)」の公募に採択されました。製造現場向けのフィジカルAI基盤として、「VTLAモデル」(Vision-Tactile-Language-Action モデル)のデータセット共同構築に取り組みます。
GENIACは生成AIやフィジカルAI分野の研究開発を国として支援する取り組みで、計算資源や資金面での後押しを企業・大学に提供しています。今回の採択は、日本のモノづくり産業をAIで高度化するための政策的な布石となります。競合関係にある3社が同じプロジェクトでデータセット構築に協力するのは異例であり、個社ごとの最適化ではなく国内産業全体の競争力底上げを優先した判断といえます。
VTLAモデルとは何か
VTLAとは、視覚(Vision)・触覚(Tactile)・言語(Language)・動作(Action)の4要素をひとつのAIモデルに統合するアーキテクチャです。カメラ映像で物体を認識し、触覚センサーで力や変形を検出し、自然言語の指示を理解した上で、ロボットアームの動作をリアルタイムに生成します。
現在、物体認識に特化した視覚AIや指示を理解する大規模言語モデル(LLM)は単体で高い精度を持ちますが、製造ロボットへの応用には複数の情報を統合しながら動作を生成する仕組みが不可欠です。VTLAモデルはその統合レイヤーとして機能し、「部品Aを指定の向きで穴に差し込め」という言語指示から、センサーフィードバックを活用した精密な動作生成まで一貫して処理できます。
従来の産業用ロボットは動作をプログラムで事前に定義する「ティーチング」が主流でした。対してVTLAモデルはセンサー情報をリアルタイムに統合しながらAIが自律的に判断するため、部品の位置ズレや個体差、予期しない接触といった状況にも柔軟に対応できる点が大きな違いです。
触覚センサーが鍵を握る理由
製造現場では、精密部品の挿入・締結・仕上げなど、力加減や微細な変形を感知しながら行う繊細な手先作業が多数あります。こうした作業は視覚情報だけでは判断が難しく、これまで自動化の壁となってきました。
触覚センサー開発を手がけるFingerVisionがプロジェクトに参画するのはこの課題に応えるためです。同社の触覚センサーは弾性体の変形をカメラで撮影するビジョンベースの構造が特徴で、接触面の力分布や滑りを高い空間分解能で検出できます。このデータをVTLAモデルに組み込むことで、「握りすぎず、緩みもしない」微妙な力加減をAIが学習できるようになります。なお、ファナックはすでに模倣学習を60時間から4.8時間に短縮するフィジカルAIの実績を持っており、今回のデータセット構築はその取り組みをさらに加速するものとして位置づけられます。
産学連携で目指すデータエコシステム
プロジェクトには大阪大学も参画し、製造現場で収集したデータの品質管理や学習手法の研究を担当します。実施期間は2026年8月から2027年7月を予定しており、データセット構築と並行してエコシステムの整備も進める方針です。
3社が収集するデータは、それぞれ異なる製造品目や工程にまたがるため、単一企業では得られない作業の多様性をカバーします。このデータを共有可能な形式で整備することで、国内のロボットAI開発全体の水準引き上げが期待されます。製造現場特有の粉塵・振動・照明変化といった環境ノイズへの対応も、実際の現場データの蓄積なしには解決が難しい課題であり、今回の産学連携体制が持つ意義は大きいといえます。
製造現場AIが直面する本質的課題
日本の製造業は少子高齢化による熟練作業者の減少という構造的課題を抱えており、繊細な手先作業を自動化できるかどうかが工場の稼働継続性を左右します。VTLAデータセットは特定製品向けではなく、異なる製造環境や作業種類をカバーする汎用性を目指して構築されます。
このデータが産業横断で活用できる形になれば、大手ロボットメーカーだけでなく、中小規模の工場や部品メーカーもVTLAモデルの恩恵を受けやすくなります。ソフトウェア中心のAI開発が注目を集めるなか、製造現場のリアルなデータに根差したこの取り組みは、日本が強みを持つハードウェアとAIを結びつける試みとして注目されます。