言語・LLM ユーザー適応型LLM:新手法TPOで再学習不要 ユーザーの好みに合わせてLLMの出力を調整する新手法TPOを提案テスト時にユーザーのフィードバックを活用し、損失関数を用いた出力の最適化TPOは再トレーニング不要でコスト削減を実現しながら競争力を持つ性能論文:Test-Time Prefe... 2025.03.31 言語・LLM論文解説