21の拡散変換器モデルを訓練・比較した結果、ImageNet FIDとT2I生成品質のピアソン相関が-0.38〜-0.58と負であることが判明。長年の評価慣行を見直すDiffusionBenchを提案します。
米ジャクソン研究所のDerya Unutmaz博士がGPT-5 Proを活用し、3年間解けなかったT細胞挙動の謎を解明した事例をOpenAIが公開。癌・自己免疫疾患研究への応用可能性と、AIが科学的発見を加速する新時代を解説します。
Qwenチームが提案する言語世界モデル「Qwen-AgentWorld」。7ドメイン・1,000万件超の実環境軌跡データをCPT→SFT→RLの3段階で学習し、LLM自体が次状態を予測する環境シミュレーターとして機能します。AgentWorldBenchでGPT-4oやGemini 2.5 Proを超える性能を達成。
ASMLが4億ドル超のHigh-NA EUV装置の量産投入を本格化させている。数値開口を0.55に引き上げることでトランジスタ密度を最大3倍に高める本装置は、AI向け次世代チップの製造基盤となり、半導体製造の競争地図を塗り替えようとしている。
分子とタンパク質の配列・3D構造・自然言語テキストを単一モデルで処理する「BioMatrix」を解説。80のタスク中77でSOTAまたは競合性能を達成した、生物学向けマルチモーダル基盤モデルの仕組みと成果を紹介します。
静的な埋め込みモデルの限界を超え、逐次更新される潜在メモリで文脈に応じた動的ベクトルを生成する「EvoEmbedding」を解説。Qwen3-Embedding-8Bなど大規模モデルを凌ぎ、RAGやエージェント記憶に直接応用できます。
元Google DeepMind研究者が設立したReflection AIが、SpaceXのColossus 2データセンターと月1.5億ドルの計算資源契約を締結。GB300チップを活用したオープンウェイトAI開発戦略を解説します。
コミュニティLoRAを合成データ生成の足場として活用し、スタイルと内容を独立制御するデュアルリファレンス画像生成「FreeStyle」。注意機構レベル制約と周波数対応RoPE変調で高品質な分離を実現しました。
LLM(大規模言語モデル)が事実と異なる情報を自信満々に生成する「ハルシネーション」の仕組みを解説。3つの種類の分類から確率的トークン生成のメカニズム、RAGやプロンプト設計による実践的な対策まで一本で解説します。
Sakana AIが複数のAIモデルを動的に組み合わせる「Sakana Fugu」を発表。Fugu UltraはTerminal-Bench 2.1でFable 5を上回るなど、一部ベンチマークでフロンティアモデルを超えると主張しています。
拡散言語モデルの並列デコードを活かし、画像内の複数マスク領域を一括でキャプション生成するPerceptionDLMを解説します。スループット3.44倍を達成し、新ベンチマークParaDLC-Benchで62.4%の精度を記録しています。
Samsung Electronicsが全世界の従業員にChatGPT EnterpriseとCodexを一斉展開。OpenAI史上最大規模のエンタープライズ導入として、製造業のAI全社活用の先例を示します。
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化
Absolicsのガラス基板とは?AIチップ性能を10倍高密度化する次世代パッケージング