教師あり学習

【GuardReasoner】LLM応答の安全を制御！出力の有害性を検出

LLMの応答を安全に制御する新手法「GuardReasoner」を提案。合成データを用いた教師あり学習で推論精度を向上し、多様なベンチマークで高い安全性と説得力を実証。

言語・LLM論文解説