強化学習 エージェント支援の科学実験フレームワーク「Boxing Gym」 科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。 2025.02.01 強化学習論文解説
言語・LLM 【SWE-Gym】ソフトウェア開発のシミュレーション学習環境! ソフトウェアエンジニアリングタスクをシミュレーションする学習環境「SWE-Gym」を提案。Transformerを使用し高精度のコード修正を実現。オープンソースで公開され、研究者や開発者が利用可能に! 2025.01.06 言語・LLM論文解説