SwiftI2Vは2段階フレームワークとCSG(セグメント単位生成)を組み合わせ、2K解像度のImage-to-Video生成においてGPU処理時間を202倍削減しながらVBench-I2Vで最高スコアを達成した新手法です。RTX 4090でも実用的な運用が可能です。
GoogleはAIスタジオ「Flow」と広告業界の著名クリエイター3名を組み合わせ、中小企業向けにスタジオ品質の広告を制作する「The Small Brief」を発表。最終キャンペーンは6月に公開予定。
Continuous-Time Distribution Matching(CDM)は、固定離散タイムステップへの依存を動的連続スケジュールで置き換えることで拡散モデルの蒸留を刷新。GANや報酬モデル不要で過平滑化を解消し、SD3-MediumとLongcat-Imageで4ステップの高品質生成を実現した新手法を解説します。
Nvidiaが2026年のわずか5ヶ月でAI企業への株式投資400億ドル超をコミット。チップメーカーからAIエコシステム全体の戦略的投資家へと転換する動向と、循環取引批判の実態を解説します。
Google DeepMindが開発した数学研究支援エージェント「AI Co-Mathematician」を解説します。非同期マルチエージェントで仮説立案から定理証明まで一貫支援し、FrontierMath Tier 4で全AIシステム中最高の48%を達成しました。
Allen AIが発表したEMOは、文書内のトークンが同じ専門家プールを共有するという制約から、健康・医療やニュース報道などのドメイン特化が自動発生するMoEモデルです。全専門家の12.5%のみで性能低下約3%に留まるため、デプロイコストの大幅削減が期待できます。
OpenAIがCodexの安全運用設計を公式解説。サンドボックス境界、承認ポリシー、ネットワーク分離、OpenTelemetryログで企業導入に必要なセキュリティ統制を実現する手法を紹介します。
埋め込みモデルとベクトル検索を使わず、grepやシェルで生コーパスを直接探索するDCI(Direct Corpus Interaction)がBRIGHTとBEIRで既存手法を大幅に上回ることを示した論文を解説します。
OpenAIが認証済み防衛者向けに「GPT-5.5-Cyber」の限定プレビューを開始。3段階の信頼アクセスフレームワークとCisco・CrowdStrike等20社のパートナーシップで構築するセキュリティフライホイールの全容を解説します。
Text VAE・ブロック因果DiT・条件付きデコードの3段階で構成されるCola DLMを解説します。連続潜在拡散によって自己回帰パラダイムとは異なるアプローチを提案し、約2Bパラメータで8ベンチマークにわたる強いスケーリング特性を示しました。
AnthropicのAIモデル「Claude Mythos Preview」がFirefox内の271件のバグを特定しました。月次修正数は従来比15倍超の423件を記録し、20年超の古いバグも発掘されています。
拡散モデルのRL微調整で美的品質・テキスト描画・構図理解など5つの報酬を同時改善する「MARBLE」を解説。二次計画法による勾配ハーモナイゼーションで従来の加重和法が抱えるスペシャリストサンプル問題を解決します。
HY-World 2.0とは?テキスト・画像・動画から3D世界を生成するマルチモーダルワールドモデル
Anthropic、Coefficient Bioを約4億ドルで買収、AI創薬に本格参入
ベクトルデータベース比較【2026年版】Pinecone・Qdrant・Weaviate・Milvusを徹底解説
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方