MoEモデルのルーター設計に数学的根拠を与えるManifold Power Iteration(MPI)を解説。エキスパート行列の主特異方向への整合で損失を改善し、下流タスク性能も向上させる新手法を紹介します。
AnthropicのダリオCEOが航空機の安全審査に相当するフロンティアAIへの第三者評価義務化を提言。政府のデプロイ差し止め権限の付与と、失業対策として3.5億ドルの拠出も表明しました。
スタンフォード大が300以上の実験で体系化したテキスト→画像拡散モデルの設計レシピ。公開データのみで訓練した3Bパラメータモデルが5ベンチマーク平均で既存オープンモデルを29.5pt上回る性能を達成しました。
Googleが2026年6月10日に公開したDiffusionGemma 26Bは、256トークンを並列生成する拡散モデルの手法でGPU推論速度を最大4倍に高速化したオープンモデルです。仕組みと性能を解説します。
Kuaishouが開発した30B MoE型マルチモーダルモデル「Keye-VL-2.0」を解説します。3Bのアクティブパラメータで256Kコンテキストを処理し、LongVideoBenchで235B超のモデルを上回る長尺動画理解性能を実現しました。
Decartが自動運転テスト向け世界モデル「Oasis 3」をAPI公開しました。フォトリアルな走行環境を1秒あたり$0.02でリアルタイム生成し、稀少なテストシナリオの量産を可能にします。
CoT微調整がハイブリッドLLMの長文書検索性能を67%から9%へ激減させる「Attention Amnesia」問題と、追加学習不要の修復法QK-Restoreを解説します。
Anthropicが最上位「Mythosクラス」モデル「Claude Fable 5」を2026年6月9日に一般公開しました。独立したAI分類器が悪用リクエストを自動検知してClaude Opus 4.8に切り替える新セーフガードと、入力100万トークンあたり10ドルのAPIを発表しました。
ARMは7Bパラメータの単一モデルで画像の理解・生成・編集を統合した自己回帰型マルチモーダルAIです。独自の離散視覚トークナイザーと強化学習でWISE総合スコアが0.50から0.56に向上し、コードも公開されています。
70言語超の音声をほぼリアルタイムで翻訳するGemini 3.5 Live Translateを発表。話者の声の抑揚やピッチを保ちながら、Google Translate・Meet・AI Studioで利用できます。
250名以上の業界専門家と共同設計した1,490タスクで構成されるAIエージェント評価ベンチマーク「ALE」を解説します。最良モデルでも全体合格率26.2%にとどまる結果が示す、現在のAIエージェントの実力と今後の課題を詳しく紹介します。
AIコーディングプラットフォームのLovableが年間収益5億ドルを達成しました。週100万件のプロジェクト生成が示すバイブコーディング市場の実態と、従来型SaaSへの影響を解説します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化