マスク領域Transformer(MRT)は、テキスト・画像・レイヤー間の3タスクを統合した20Bパラメータ拡散モデルです。Qwen-Image-Layeredと比較して最大108倍の高速化と90%のメモリ削減を実現し、デザイン向け画像生成・編集の実用性を大幅に高めます。
2026年5月27日の参院本会議でデジタル担当大臣が「この答弁もAIが原案を作成した」と公言しました。全府省庁で運用を始めた行政AI基盤「源内」の概要と、職員の確認・決裁プロセスを解説します。
229.9Bパラメータのうちトークンあたり9.8B(約4.3%)のみ起動する超疎MoEモデルMiniMax-M2を解説します。AIME 2026で94.2%、GPQA-Diamondで89.8%を達成し、大幅に少ない計算量でフロンティアAIと同等の性能を実現しました。
AIゲートウェイのOpenRouterがGoogle傘下CapitalG主導のシリーズBで1.13億ドルを調達し、評価額は1年で2倍超の13億ドルへ到達。400以上のモデルへ単一APIでアクセスできるマルチモデル基盤の急成長を解説します。
人手アノテーション不要の合成タスク8,000件だけでGPT-4o相当の深層調査エージェントを訓練するQUESTを解説。統一ルーブリック木による自動報酬生成と強化学習の仕組みを紹介します。
「AIがホワイトカラーの仕事を奪う」という言説が広がる中、雇用統計データは異なる現実を示しています。MIT Technology Reviewの分析をもとに、パニックと現実の乖離を検証します。
三角形プリミティブで3Dシーンを再構成するフィードフォワード手法「TriSplat」を解説します。幾何精度40%向上と最大249倍の高速化を実現し、UnityやIsaac Simへの直接インポートにも対応します。
AnthropicのProject Glasswingが1カ月で1万件超の重大な脆弱性を自動検出。AIの発見速度が人間のパッチ適用を大幅に上回る新たな課題と、企業向け対応ツールの取り組みを解説します。
圧縮動画をデコードせずコーデックストリームとして処理する新手法「codec-stream tokenization」を解説します。JumpScoreでQwen3-VL-8Bを+44.8ポイント上回り、動画・空間・追跡の3領域で同時改善を実現しました。
タスク管理SaaSを提供するClickUpが従業員の22%を解雇し、3,000体のAIエージェントへと移行しました。大規模な人間業務代替の実例から「仕事の未来」を解説します。
DiTの残差接続が抱える前向き膨張・後向き勾配減衰・ブロック冗長性を解決するDAR(Diffusion-Adaptive Routing)を解説。FIDスコアを9.67から7.56に改善し、学習ステップを8.75分の1に短縮します。
このガイドを読めば、SFT・LoRA・DPOを使い分けながら自社データへの特化を数十行のコードで実現でき、評価から運用改善サイクルまで一貫して理解できます。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
Sapiens2とは?MetaのヒューマンAI基盤モデルが5Bパラメータ・4K解像度で姿勢・法線・点群推定を統合
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説