商湯科技が発表したSenseNova-U1は、独立した視覚エンコーダとVAEを排除したNEO-unifyアーキテクチャで理解と生成を単一モデルに統合。視覚推論からVLA・世界モデルまで幅広いタスクで高性能を達成します。
OpenAIの公式調査によると、2026年Q1にChatGPT利用者の年齢・性別・地域が多様化。35歳以上や女性ユーザーの比率が上昇し、AIが一般社会へ定着しつつある実態を解説します。
64人の数学者が設計した研究レベル数学ベンチマーク「Soohak」を解説します。最先端モデルでもGemini-3-Proが30.4%、GPT-5が26.4%止まりで、不当な問題を見抜く「Refusal Subset」ではいかなるモデルも50%未満でした。
AI音声スタートアップVapiが5000万ドルのシリーズBを調達し、評価額5億ドルを達成しました。Amazon Ringが40社超を評価した末に採用した理由と、累計10億件超の通話を処理するプラットフォームの成長戦略を解説します。
QwenチームのQwen-Image-2.0はQwen3-VLとMultimodal Diffusion Transformerを組み合わせ、生成と編集を1モデルに統合。1,000トークン対応で多言語タイポグラフィも大幅改善しました。
元OpenAI CTOが設立したThinking Machines Labが、話しながら同時にユーザーの声を聞ける全二重AIモデルを発表。応答速度0.40秒でOpenAIとGoogleを上回るベンチマーク結果を示します。
Flow Matchingを言語生成に初めて本格適用した拡散言語モデル「ELF」を解説します。最終ステップまで連続埋め込み空間にとどまる設計でCFGが自然に転用可能となり、少ないトレーニングで既存DLMを上回る性能を達成しました。
2024年ノーベル経済学賞のアセモグル教授が、AIエージェントの限界・経済学者採用の利益相反・アプリ普及の遅れという3つの課題を指摘。楽観論が先行するAI議論に、実証データに基づく慎重な視点を提供します。
拡散モデルの超深層化で発生するトークン均質化崩壊「Mean Mode Screaming」を初特定。MV-Split残差で世界初の1000層DiT安定学習とFID 2.68を達成した研究を解説します。
スタンフォード大学・インペリアル・カレッジ・ロンドン・Internet Archiveの共同研究が、ChatGPT公開後に開設されたWebサイトの約35%にAI生成テキストが含まれることを実証。インターネット全体の情報品質変容を解説します。
OpenAIが企業向けAIデプロイ専門子会社「DeployCo」を設立。Tomoro買収で約150名のエンジニアを即戦力化し、TPGなど19社のパートナーとともに40億ドル超の初期投資で本格展開します。
Test-Time Scaling戦略の設計を自動化するAutoTTSをGoogleが提案しました。LLMエージェントがオフラインリプレイ環境で反復的に戦略を探索・評価し、わずか$39.9・160分で手動設計を上回る推論戦略を発見します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入