モンテカルロ木探索

【rStar-Math】小型LLMの数学力を向上！モンテカルロ木探索を使って最適解を選択

小型LLMの数学的思考を向上させる新フレームワーク「rStar-Math」を提案。モンテカルロ木探索と自己進化型深層思考を組み合わせることで、計算コストを抑えつつ高い性能を実現した実験結果が報告されました。

言語・LLM論文解説