AnthropicがSDK自動生成ツール「Stainless」を買収しました。OpenAI・Google・Cloudflareも利用する開発者インフラを取り込んだ戦略的意図を解説します。
正しい答えを返しながら根拠箇所を誤引用する「帰属ハルシネーション」を体系的に定量化するベンチマーク「CiteVQA」が公開されました。711本のPDF・1,897問・7ドメインで構成し、最強モデルでもSAA 76.0%という大きなギャップを明らかにします。
コンテキストウィンドウはLLMの「作業記憶」です。トークンの仕組み、FIFO方式のオーバーフロー、Lost in the Middle問題、KVキャッシュ、RAGとの連携まで初心者向けにわかりやすく解説します。
IBM ResearchとHuggingFaceが、モデル単体でなくエージェント全体を評価する「Open Agent Leaderboard」を公開。同じモデルでも実装次第で成功率とコストが大きく変わることが明らかになりました。
人間の一人称視点映像を物理常識QAへ変換しロボット制御に転移するVLAモデル「PhysBrain 1.0」が登場。Franka実機での操作成功率を47.1%から63.3%に引き上げ、複数ベンチマークで最高性能を達成しました。
GPT-5の統合でMicrosoft 365 Copilotの操作性が大きく向上し、複雑なプロンプト設計が不要になりつつあります。Microsoft MVPの座談会をもとに、現場での活用変化と導入指針を解説します。
自己回帰型画像生成のトークナイザが抱えるテキスト文字の潰れ・顔ディテール喪失を、コンテンツ対応の局所知覚損失で解決する新手法「InsightTok」を解説します。NED精度95.83%、顔類似度でEmu3.5-IBQを超える結果を16kコードブックで達成。
Ford・GM・Stellantisが2020年代の雇用ピーク比19%にあたる2万人超を2024〜2025年に削減。GMはIT部門10%超を整理しAI人材採用に切り替え。自動車業界でのAI主導の人材構造転換を詳しく解説します。
VGGT-Editは、テキスト指示によるネイティブ3Dシーン編集をフィードフォワード推論で実現する新手法です。深度同期テキスト注入とレジデュアル変換ヘッドで多視点一貫性を保ちながら、従来手法比2〜120倍の速度で高品質な編集を達成します。
2025年1月、中国では1日平均470本のAI生成短編ドラマがリリースされ、FlexTVなど主要プラットフォームが実写制作を停止してAIへ全面移行した実態が浮き彫りになった。製作コストは最大90%削減され、産業構造の変容が加速している。
カメラ誘発ワープを「擬似履歴」として既存ビデオモデルに注入し、モデルの重みを変えずにカメラ制御を実現する新手法「Warp-as-History」を解説します。1本の動画でのLoRA学習でカメラ制御スコアを134.7%改善します。
世界最大の学術プレプリントサーバーarXivが、LLMへの論文丸投げを確認した著者を最長1年間投稿禁止にする新ポリシーを発表。AI使用の可否よりも「責任ある使用」が問われる段階に入りました。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング