データセット GPT-4で地理情報推論力を評価するデータセット「MapEval」の提案 新データセット「MapEval」を提案し、地理空間推論能力を評価。リアルな地理情報を基にした新たなLLM評価方法を確立。最新のGPT-4等で性能を検証し、課題を発見する試み。 2025.01.24 データセット論文解説
言語・LLM 生成回答を改善する自己修正手法「ProgCo」の効果やいかに 言語モデルの能力向上手法としてProgCoを提案。プログラムで生成された回答を検証・改善するプロセスを導入し、実験でGPT-3.5やGPT-4の性能を向上。自己修正で言語モデルの有用性を強化。 2025.01.15 言語・LLM論文解説
ニュース 2024年のAI動向を振り返る!GPT-4超え70モデル登場 2024年、AI市場が劇的に進化!GPT-4を超える70のAIモデル登場し、コンテキストウィンドウが大幅に拡張。特にGoogleのGemini 1.5 Proが注目。価格低下で多くの分野での革新が期待されます。 2025.01.07 ニュースビジネス