CORALとは？自律マルチエージェント進化で探索問題の改善率を最大10倍に高める新フレームワーク

固定ヒューリスティクスに依存せず、LLMエージェントが自律的に探索・学習するフレームワーク
共有メモリと非同期実行により複数エージェントが協調進化し、従来手法比3〜10倍の改善率を達成
ニューラルアーキテクチャ探索、データキュレーション、強化学習の3領域で新記録を樹立

研究の背景

AI研究における開放的探索（open-ended discovery）では、継続的な探索と知識の蓄積が成果を左右します。しかし従来のLLMベース進化手法は、問題ごとに人手で設計した探索ルールや戦略である「固定ヒューリスティクス」に大きく依存していました。

このアプローチでは、探索戦略が事前に決められた規則に縛られるため、予期しない発見や柔軟な適応が困難でした。特に数学的問題、アルゴリズム最適化、システム設計といった多様なタスクでは、固定的な探索方針では最適解に到達できないケースが頻発していました。

2026年4月に発表されたCORAL（Towards Autonomous Multi-Agent Evolution for Open-Ended Discovery）は、Ao Quら17名の研究チーム（MIT、シンガポール国立大学など）が提案した、この課題を解決する初の自律的マルチエージェント進化フレームワークです。

CORALの仕組み

CORALは固定的な制御ルールを排除し、長時間稼働するLLMエージェントが共有メモリを通じて探索、反省、協調を行う設計を採用しています。主要な技術要素は以下の通りです。

共有永続メモリにより、複数のエージェントが探索履歴や成功パターンを記録・参照できます。これにより、あるエージェントの発見を他のエージェントが活用し、知識が蓄積されていく仕組みです。

非同期マルチエージェント実行では、各エージェントが独立したペースで探索を進めつつ、定期的に情報を共有します。エージェント間の通信はheartbeat（心拍）ベースの介入機構で管理され、必要に応じて協調動作が発動します。

実用性を高めるため、分離されたワークスペース、評価器の独立性、リソース管理、エージェントのセッション・健全性管理といった安全機構も実装されています。これにより、エージェントが暴走したり、リソースを枯渇させたりするリスクを抑制しています。

図1: CORALのアーキテクチャ概要 —— 複数エージェントが共有メモリを介して協調進化する

実験結果と性能評価

CORALは数学、アルゴリズム、システム最適化の多様なタスクで評価され、10のタスクで新たな最高記録を樹立しました。従来の固定的進化探索ベースラインと比較して、3〜10倍の改善率を少ない評価回数で達成しています。

ニューラルアーキテクチャ探索（AIモデルの層構造や接続方式を自動で最適化する手法）では、CORALが生成したアーキテクチャが従来手法を大幅に上回る精度を記録しました。エージェントが過去の探索結果から学習し、有望な構造パターンを自律的に発見したことが要因です。

データキュレーション領域では、画像分類タスク用のデータセット品質向上を目的とした実験を実施しました。CORALは複数エージェントがデータ選択基準を反復的に改善し、最終的にベンチマークデータセット比で分類精度を5〜8%向上させる高品質なサブセットを構築しました。エージェント間の知識共有により、ノイズデータの除去と有用サンプルの抽出が効率化されたことが確認されています。

強化学習アルゴリズム設計では、連続制御タスク（ロボットアーム操作など）において、CORALが既存の強化学習アルゴリズムの探索戦略と報酬設計を自動的に改良しました。4つの共進化エージェントが異なる探索方針を試行し、成功パターンを共有することで、学習効率が従来比で約7倍に向上しました。

特筆すべき成果として、Anthropicのカーネルエンジニアリングタスクでは、4つの共進化エージェントが既知の最良スコア1363サイクルを1103サイクルまで改善しました。これは約19%の性能向上に相当し、[エージェント技術の実用性](/gradient-labs-gpt41-banking-ai-agent-97-accuracy-98-csat)が高度な最適化問題でも実証された形です。

知識再利用とマルチエージェント協調の分析

CORALの高い改善率の背景には、知識再利用とマルチエージェント探索・通信のメカニズムがあります。研究チームの分析により、以下の点が明らかになりました。

知識再利用の観点では、エージェントが共有メモリに記録された過去の探索履歴を参照することで、同じ失敗を繰り返さずに効率的に探索空間を絞り込んでいます。成功パターンのテンプレート化も進み、類似問題への転用が可能になりました。

マルチエージェント協調では、各エージェントが異なる探索戦略を並行実行し、多様な解候補を生成します。heartbeat機構により、特に有望な発見があった際には他のエージェントにシグナルが送られ、協調的な深掘りが発動する仕組みです。この分業と協調のバランスが、固定ヒューリスティクスでは到達できない解の発見を可能にしています。