本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、モバイルアプリのGUI(グラフィカルユーザインタフェース)上で動作するエージェントを評価・改善するため […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、言語モデル(LLM)における自己修正能力を強化する新しい手法「ProgCo(Program-drive […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、LLM(大規模言語モデル)がコード生成における自己呼び出し関数を生成する能力を評価するため、新しいベ […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、ソフトウェアエンジニアリングのタスク用に設計された新しい学習環境「SWE-Gym」を提案しています。 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、OpenAIのようなモデルをベースとしたo1ライクモデル(例えば、「2+3」のようなシンプルな質問に […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、ロシア語への適応を目的とした大規模言語モデル(LLM)の改良方法「学習型埋め込み伝播(Learned […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、LLM(大規模言語モデル)の推論プログラムを効率的に提供するための「Certainties」という新 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 この研究のポイントは? この論文では、LLMが快感と苦痛を考慮した意思決定ができるかを検証しています。 この成果は、AIの感情理 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 この研究のポイントは? 本論文は、Transformerモデルが不要な文脈に過剰に注意を向けてしまう問題に着目し、新しい「Dif […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 この研究のポイントは? 本論文は、多数の会話を含む検索拡張生成(RAG)システムの評価のための新しいベンチマーク「CORAL」を […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 この研究のポイントは? 本論文は、大規模言語モデル(LLM)の「誤った出力(ハルシネーション)」について、その原因を「知識の欠如 […]
LLM高速化手法「Self-Distillation Through Time(SDTT)」を解説。自己蒸留により投機的デコーディングを改善し、最大32トークンの同時生成を実現する仕組みと性能評価を紹介します。
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
OpenClaw-RLとは?次状態信号から報酬を自動抽出し任意のRLエージェントを訓練する統合フレームワーク
Step 3.5 Flashとは?110億パラメータでGPT-5.2級の性能を達成したオープンモデル