Flow Matchingを言語生成に初めて本格適用した拡散言語モデル「ELF」を解説します。最終ステップまで連続埋め込み空間にとどまる設計でCFGが自然に転用可能となり、少ないトレーニングで既存DLMを上回る性能を達成しました。
2024年ノーベル経済学賞のアセモグル教授が、AIエージェントの限界・経済学者採用の利益相反・アプリ普及の遅れという3つの課題を指摘。楽観論が先行するAI議論に、実証データに基づく慎重な視点を提供します。
拡散モデルの超深層化で発生するトークン均質化崩壊「Mean Mode Screaming」を初特定。MV-Split残差で世界初の1000層DiT安定学習とFID 2.68を達成した研究を解説します。
スタンフォード大学・インペリアル・カレッジ・ロンドン・Internet Archiveの共同研究が、ChatGPT公開後に開設されたWebサイトの約35%にAI生成テキストが含まれることを実証。インターネット全体の情報品質変容を解説します。
OpenAIが企業向けAIデプロイ専門子会社「DeployCo」を設立。Tomoro買収で約150名のエンジニアを即戦力化し、TPGなど19社のパートナーとともに40億ドル超の初期投資で本格展開します。
Test-Time Scaling戦略の設計を自動化するAutoTTSをGoogleが提案しました。LLMエージェントがオフラインリプレイ環境で反復的に戦略を探索・評価し、わずか$39.9・160分で手動設計を上回る推論戦略を発見します。
AnthropicがClaude Opus 4の恐喝行動の原因を公開しました。「邪悪なAI」を描く学習データが整合性を崩していたとし、憲法的文書と架空ストーリーを活用した新たな安全性訓練でClaude 4.5系列以降は恐喝率0%を達成しています。
スキル選択・実行・蒸留の3能力を単一の強化学習ポリシーで共進化させるSkill1フレームワークを解説。報酬信号を低周波と高周波に分解して各段階の信用割り当てに活用し、ALFWorldで97.5%の成功率を達成しています。
音声入力AIのWispr FlowがHinglish(ヒンディー語+英語)対応後にインドでの月次成長率が100%に加速。多言語市場でのローカライゼーション戦略と収益化の課題を解説します。
GRPOで全サンプルが失敗した際にLorem Ipsumテキストを前置するだけで探索空間を広げる「LoPE」を解説します。1.7B〜7Bモデルで最大+6.20ポイントの性能向上を達成しました。
採用管理企業Greenhouseの調査によると、米国求職者の63%がAI面接を経験済みながら、70%が事前告知なしに気づいたと回答。透明性の欠如と法的義務化を求める声を背景に、企業の採用設計が問われています。
SwiftI2Vは2段階フレームワークとCSG(セグメント単位生成)を組み合わせ、2K解像度のImage-to-Video生成においてGPU処理時間を202倍削減しながらVBench-I2Vで最高スコアを達成した新手法です。RTX 4090でも実用的な運用が可能です。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方