強化学習 エージェント支援の科学実験フレームワーク「Boxing Gym」 科学実験支援フレームワーク「Boxing Gym」を提案。エージェントが実験設計、結果解釈、新たな仮説を学びつつ、言語モデルで科学データの解釈をサポート。エージェントの限界も報告。 2025.02.01 強化学習論文解説
言語・LLM 生成回答を改善する自己修正手法「ProgCo」の効果やいかに 言語モデルの能力向上手法としてProgCoを提案。プログラムで生成された回答を検証・改善するプロセスを導入し、実験でGPT-3.5やGPT-4の性能を向上。自己修正で言語モデルの有用性を強化。 2025.01.15 言語・LLM論文解説
言語・LLM 埋め込み技術で強化されたロシア語LLMの新成果 ロシア語特化大規模言語モデルの改良法「学習型埋め込み伝播」を提案。埋め込み空間の整合性向上で未学習領域でも高性能を実現。複数ロシア語ベンチマークで優れた結果を確認。 2025.01.06 言語・LLM論文解説