NVIDIAがCosmos世界モデルやIsaac GR00T N1.6など、ロボット向けPhysical AIモデル群をオープンソース公開。Caterpillar建設機械やLEM Surgical手術ロボットなどの実用化事例を解説します。
Perplexityが発表した「Model Council」を解説。Claude Opus 4.6、GPT-5.2、Gemini 3.0を同時実行し、合成モデルが矛盾を解消するマルチモデル合議方式の仕組みを紹介します。
離散トークンをビット単位で段階的に予測する新手法「BAR」が、ImageNet-256でFID 0.99を達成。Diffusionモデルを含む従来手法を上回る生成品質と最大20倍の高速化を両立し、画像生成の新たなパラダイムを提示しました。
AppleとGoogleがAI分野で複数年にわたる歴史的パートナーシップを締結。GoogleのGeminiモデルとクラウドインフラがAppleの基盤モデルに統合され、SiriとApple Intelligenceが大幅に強化される。OpenAIやAnthropicへの対抗を見据えた戦略的提携の全貌を解説する。
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、複数エージェント間の協調を目的とした新しい手法「Shared Recurrent Memory Tr […]
ユーザーの好みに合わせてLLMの出力を調整する新手法TPOを提案 テスト時にユーザーのフィードバックを活用し、損失関数を用いた出力の最適化 TPOは再トレーニング不要でコスト削減を実現しながら競争力を持つ性能 論文:Te […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、仮想3D空間における映像制作を自動化するための新しいフレームワークである「FILMAGENT」を提案 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 本論文では、LLM(大規模言語モデル)の推論能力を向上させるために、新たな強化学習手法とモデル構造を提案しています […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、Mixture-of-Experts (MoE) モデルの学習における「Load-balancing […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、言語モデルエージェントが自らの行動を反省し改善する能力を持つ新しい学習フレームワーク「Agent-R […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、「GameFactory」と呼ばれる新しい生成モデルを提案し、ゲームプレイのシーンをビデオとして生成 […]
本記事で使用している画像は論文中の図表、またはそれを参考に作成した画像を使用しております。 本論文の概要 この論文では、より高度なLLM(大規模言語モデル)の推論能力を育成するための新たなアプローチとして「Mind Ev […]
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング