人間の一人称視点映像(エゴセントリック映像)を適切に処理すると実ロボットデータを凌駕することを実証した「HumanScale」を解説。分布外タスクで90%の成功率向上を達成し、身体的AIのデータ収集コスト問題に新たな解法を示します。
マイアミ発スタートアップSubquadraticが、LLMの計算ボトルネックを解消する疎注意技術「SubQ」を発表しました。FlashAttention比56倍高速化と1200万トークンのコンテキストウィンドウを主張しています。
わずか0.22Bパラメータで産業用10Bモデル「FLUX.1-Fill-Dev」に匹敵する画像修復品質を実現する軽量フレームワーク「Moebius」を紹介します。LλMIブロックと適応的多粒度蒸留により推論速度15倍超を達成し、個人開発者のGPUでも高品質な画像修復が可能です。
HuggingFace PEFTチームがLoRA・OFT・GraLoRAなど6手法を画像生成と数学推論の2タスクで実測比較。OFTが画像生成でLoRAを精度・VRAM効率ともに上回る結果を詳しく解説します。
ServiceNow Researchが実証したMosaicLeaks研究を解説します。社内文書と外部検索を組み合わせるAIエージェントが検索クエリを通じて機密情報を漏洩させるリスクと、漏洩率を34%から9.9%に削減するPA-DR手法を紹介します。
物理AI向け世界モデル「Kairos」は、3種の注意機構を組み合わせたハイブリッド時間アーキテクチャで誤差蓄積の上限を理論的に証明し、RoboTwin 2.0など複数ベンチマークで最高水準の性能を達成しました。
Cursor・Claude Code・GitHub Copilot・Windsurfの4大AIコーディングツールを、MCP統合・エージェント機能・SWE-benchベンチマーク・価格体系の観点から徹底比較し、ワークフロー別の選び方を解説します。
HuggingFaceが公開した「agent-eval」は、AIエージェントのライブラリ操作能力を正答率だけでなくトークン消費・エラー回数・実行時間でも評価するベンチマークです。大規模モデルにはCLI補助が有効でも小規模モデルには逆効果になるという実証知見を解説します。
OpenAIとMolecule.oneが共同開発したGPT-5.4搭載「AIケミスト」が、薬化学の難易度の高い反応を改善したとOpenAI公式ブログで発表。新薬開発の期間短縮につながる可能性があります。
Uniform Diffusion LMを7Bパラメータ・1.5兆トークンでフルスクラッチ訓練し、知識・推論・コーディングで自己回帰モデルと同等性能を実証した初の大規模研究を紹介します。
GoogleのAI医療システムAMIEが、慢性疾患の長期管理で主治医21名と同等の推論能力を示した研究がNature誌に掲載されました。治療計画の精度とガイドライン準拠では医師を上回る結果も得られています。
7BパラメータのループTransformer「LoopCoder-v2」が2ループ動作でSWE-bench Verified 64.4点を達成しました。ループ3回以上で性能が逆に低下する非単調効果の仕組みを解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング