連続潜在空間で音声をモデル化する20億パラメータのTTS基盤モデルdots.ttsを解説。AudioVAEと自己補正後学習で中国語WER 0.94%・英語WER 1.30%を達成し、初音遅延85msも実現。Apache 2.0で完全公開予定。
Anthropicが2026年6月、エージェント型AI「Claude Cowork」をPro・Team・Enterpriseの全有料プランで一般提供開始。RBAC・OpenTelemetry・Zoom MCPなど組織展開向け管理機能を一斉に拡充しました。
タスク固有の教師データなしでLLMエージェントがスキルを自己構築する「OpenSkill」を解説。SkillsBenchで43.6%のパス率を達成し、モデル間のスキル転移も実証しました。
OpenAIの幹部がFinancial Timesで「チャットは終わった」と発言。数週間以内にChatGPTをエージェント機能とコーディングツールを統合したスーパーアプリへ刷新する計画を解説します。
拡散モデルの生成タイムラインをde Boorの等分配原理で自動分割する「複雑性均衡拡散分割(CBS)」を解説します。SiT-XL/2でFIDを35%改善しながら推論コストは変わりません。
カリフォルニア大学の心理学者Gloria Markの30年研究によると、平均注意集中時間は2003年の2分30秒から現在は47秒まで短縮した。AIチャットボットへの認知依存が批判的思考力を低下させる実態を解説する。
Dream.exeは8種類の動画生成モデルを101件のロボット操作タスクで評価し、視覚的品質と物理的実行成功率が無相関(r=−0.03)という事実を実証した新評価フレームワークです。
トランプ政権がOpenAIへの株式取得を協議していると報じられました。政府がAI企業に直接出資する前例なき動きの背景と、インテル出資との比較や各方面の反応を解説します。
Goedel-ArchitectはLean 4形式証明エージェント。補題の依存グラフを生成・洗練し、IMO 2025の6問中4問・MiniF2F-testで99.2%を達成。類似システムより最大500倍コスト効率に優れます。
OpenAIが「Lockdown Mode」を発表しました。ウェブ閲覧やエージェントモードを無効化することで、プロンプトインジェクション攻撃から機密データを守る企業向けの新機能です。
世界シミュレーターを外部ツールとして呼び出し「未見視点の画像」を生成してから推論するVLMフレームワーク「Astra」を解説。2段階の強化学習でMMSI-Benchの精度を+9.0点改善した仕組みを紹介します。
ケンブリッジ大学とDIOSynVaxが機械学習で設計した人工抗原ワクチンが、健康成人39人への第1相臨床試験で安全性と免疫応答を確認しました。AI設計の抗原がヒト体内で機能した世界初の事例を解説します。
MolmoAct2とは?GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説
SANA-WMとは?単一GPUで720p・60秒動画を生成するNVIDIAの効率的世界モデル
LLMはなぜ日本文化に偏る? 欧州研究が明かすAIの隠れた文化バイアス
GitHub Copilot がトークン課金制へ移行、一部ユーザーで月額29ドルが750ドルに急騰
arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化