データセット 競技プログラミング向けベンチマーク「CodeELO」登場 競技プログラミングの新しいベンチマーク「CodeELO」を提案。Eloレーティングを用いてモデルと人間のパフォーマンスを比較し、言語理解能力や推論能力を詳細に評価。新たな競技環境での能力を測定可能。 2025.01.28 データセット論文解説