記事一覧 (20ページ目)

論文解説画像

PixVerveとは？100メガピクセルのネイティブ画像生成を実現した新フレームワーク

テキストから1億画素（100MP）の超高解像度画像をネイティブ生成するフレームワーク「PixVerve」を解説。9.5万枚のデータセットと8指標の評価ベンチを合わせて紹介します。

2026年5月20日

PixVerveとは？100メガピクセルのネイティブ画像生成を実現した新フレームワーク

ニュース技術

Google Gemini 3.5 Flash発表 — 競合比4倍高速でエージェント処理を大幅短縮

GoogleがGemini 3.5 Flashを発表。競合フロンティアモデル比4倍の出力速度と最高水準のエージェント性能を両立し、並列サブエージェント実行で複雑な開発タスクの処理時間を大幅に短縮します。

2026年5月20日

Google Gemini 3.5 Flash発表 — 競合比4倍高速でエージェント処理を大幅短縮

論文解説マルチモーダル

Lanceとは？画像・動画の理解・生成・編集を単一モデルで統合するByteDanceの新手法

ByteDanceが提案するLanceは、画像・動画の理解・生成・編集を単一モデルで統合するフレームワークです。3Bの活性化パラメータで7BクラスのShow-o2やBAGELを複数ベンチマークで上回る性能を発揮します。

2026年5月19日

Lanceとは？画像・動画の理解・生成・編集を単一モデルで統合するByteDanceの新手法

論文解説画像

VFMTokとは？視覚基盤モデルを凍結転用した高速・高精度画像生成トークナイザー

凍結した視覚基盤モデル（VFM）を画像トークナイザーへ転用するVFMTokを解説します。領域適応的量子化とセマンティック再構成目標により、ImageNetでgFID 1.36を達成し、収束速度3倍・推論速度最大4倍の高速化も実現します。

2026年5月19日

VFMTokとは？視覚基盤モデルを凍結転用した高速・高精度画像生成トークナイザー

ニュースビジネス

マスク対OpenAI裁判、陪審員全員一致でマスク敗訴 — 時効が決め手でOpenAIの営利転換計画は継続へ

イーロン・マスクがOpenAI共同創業者を訴えた裁判で、陪審員9名が全員一致でマスクの請求を棄却しました。決め手は「時効」という法的理由です。OpenAIの営利転換計画への影響と今後の展望を解説します。

2026年5月19日

マスク対OpenAI裁判、陪審員全員一致でマスク敗訴 — 時効が決め手でOpenAIの営利転換計画は継続へ

論文解説動画

LongLive-2.0とは？NVFP4並列インフラで長時間動画生成を2倍高速化する新手法

NVIDIAが発表したLongLive-2.0は、NVFP4（4bit浮動小数点）精度を訓練・推論の全工程に適用した長時間動画生成インフラです。Balanced SPとNVFP4の組み合わせで訓練2.15倍・推論1.84倍の高速化を達成し、5BモデルでFPS45.7のリアルタイム生成を実現しました。

2026年5月19日