強化学習 行動改善が可能な新学習フレームワークAgent-Rの提案 この論文では、反省と改善が可能な学習フレームワーク「Agent-R」を提案。Monte Carlo Tree Searchで成功と失敗を分析し修正するプロセスを実装し、3つの環境で高性能を発揮、新タスクへの一般化能力も確認。 2025.03.31 強化学習論文解説