学習環境

強化学習

エージェント支援の科学実験フレームワーク「Boxing Gym」

科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。
言語・LLM

【SWE-Gym】ソフトウェア開発のシミュレーション学習環境!

ソフトウェアエンジニアリングタスクをシミュレーションする学習環境「SWE-Gym」を提案。Transformerを使用し高精度のコード修正を実現。オープンソースで公開され、研究者や開発者が利用可能に!