記事一覧 (21ページ目)

InsightTokとは？自己回帰型画像生成でテキスト・顔品質を高めるコンテンツ対応トークナイザ

自己回帰型画像生成のトークナイザが抱えるテキスト文字の潰れ・顔ディテール喪失を、コンテンツ対応の局所知覚損失で解決する新手法「InsightTok」を解説します。NED精度95.83%、顔類似度でEmu3.5-IBQを超える結果を16kコードブックで達成。

2026年5月18日

InsightTokとは？自己回帰型画像生成でテキスト・顔品質を高めるコンテンツ対応トークナイザ

ニュースビジネス

GM・Ford・Stellantisが2万人削減しAI人材争奪へ — 自動車業界のスキル転換が加速

Ford・GM・Stellantisが2020年代の雇用ピーク比19%にあたる2万人超を2024〜2025年に削減。GMはIT部門10%超を整理しAI人材採用に切り替え。自動車業界でのAI主導の人材構造転換を詳しく解説します。

2026年5月18日

GM・Ford・Stellantisが2万人削減しAI人材争奪へ — 自動車業界のスキル転換が加速

論文解説画像

VGGT-Editとは？テキスト指示で3Dシーンをフィードフォワード即時編集する新手法

VGGT-Editは、テキスト指示によるネイティブ3Dシーン編集をフィードフォワード推論で実現する新手法です。深度同期テキスト注入とレジデュアル変換ヘッドで多視点一貫性を保ちながら、従来手法比2〜120倍の速度で高品質な編集を達成します。

2026年5月17日

VGGT-Editとは？テキスト指示で3Dシーンをフィードフォワード即時編集する新手法

ニュースビジネス

中国の短編ドラマ産業がAIコンテンツ工場に変貌、1日470本・製作コスト最大90%削減

2025年1月、中国では1日平均470本のAI生成短編ドラマがリリースされ、FlexTVなど主要プラットフォームが実写制作を停止してAIへ全面移行した実態が浮き彫りになった。製作コストは最大90%削減され、産業構造の変容が加速している。

2026年5月17日

中国の短編ドラマ産業がAIコンテンツ工場に変貌、1日470本・製作コスト最大90%削減

論文解説動画

Warp-as-Historyとは？フリーズモデルで実現するゼロショットカメラ制御ビデオ生成

カメラ誘発ワープを「擬似履歴」として既存ビデオモデルに注入し、モデルの重みを変えずにカメラ制御を実現する新手法「Warp-as-History」を解説します。1本の動画でのLoRA学習でカメラ制御スコアを134.7%改善します。

2026年5月17日

Warp-as-Historyとは？フリーズモデルで実現するゼロショットカメラ制御ビデオ生成

ニュースビジネス

arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化

世界最大の学術プレプリントサーバーarXivが、LLMへの論文丸投げを確認した著者を最長1年間投稿禁止にする新ポリシーを発表。AI使用の可否よりも「責任ある使用」が問われる段階に入りました。

2026年5月17日

論文解説データセット

MemLensとは？789問で測るマルチモーダル長期記憶—最先端モデルも30%以下に留まる

NVIDIAが提案したMemLensは789問・5能力・4段階のコンテキスト長でマルチモーダル長期記憶を評価する初の体系的ベンチマークです。最先端モデルも30%以下に留まる視覚記憶の壁を解説します。

2026年5月17日

MemLensとは？789問で測るマルチモーダル長期記憶—最先端モデルも30%以下に留まる

ニュースビジネス

Greg BrockmanがOpenAI製品戦略トップに就任、ChatGPTとCodexの統合計画が浮上

OpenAI共同創業者のGreg Brockmanが製品戦略責任者に正式就任しました。ChatGPTとプログラミング製品Codexを単一プラットフォームへ統合する計画も社内メモで明らかになっています。

2026年5月17日

Greg BrockmanがOpenAI製品戦略トップに就任、ChatGPTとCodexの統合計画が浮上

論文解説動画

RefDecoderとは？参照フレーム注入で動画品質を最大+2.1dB向上させる新手法

動画VAEのデコーダに参照フレームを直接注入する「RefDecoder」が提案されました。ファインチューニング不要でWan 2.1やVideoVAE+に即座に適用でき、PSNRを最大+2.1dB向上させる新手法を解説します。

2026年5月16日

RefDecoderとは？参照フレーム注入で動画品質を最大+2.1dB向上させる新手法

ニュースビジネス

OpenAI、マルタ政府と提携——全市民にChatGPT Plus、世界初の国家AI普及モデル

OpenAIがマルタ政府と提携し、全市民約53万人へのChatGPT Plus提供とAIスキル教育を国家事業として展開すると発表。政府がAIサブスクを公共サービスとして配布する世界初のモデルを解説します。

2026年5月16日

OpenAI、マルタ政府と提携——全市民にChatGPT Plus、世界初の国家AI普及モデル

論文解説強化学習

SDARとは？自己蒸留とRLの統合でLLMエージェント多ターン訓練を安定化する新手法

LLMエージェントの多ターン訓練における報酬信号の不安定性を解消する新手法「SDAR」を解説します。シグモイドゲートによる選択的自己蒸留とGRPOを統合し、ALFWorldで+9.4%、WebShopで+10.2%の性能改善を実現しました。

2026年5月16日

SDARとは？自己蒸留とRLの統合でLLMエージェント多ターン訓練を安定化する新手法

ニュースビジネス

DatabricksがGPT-5.5採用、エンタープライズAIエージェントでOfficeQA Pro最高性能を達成

DatabricksがGPT-5.5をエンタープライズAIエージェントに採用し、業務文書QAベンチマークOfficeQA Proで最高性能を達成したとOpenAIが発表しました。データ基盤とLLMの垂直統合戦略を詳しく解説します。

2026年5月16日

InsightTokとは？自己回帰型画像生成でテキスト・顔品質を高めるコンテンツ対応トークナイザ

GM・Ford・Stellantisが2万人削減しAI人材争奪へ — 自動車業界のスキル転換が加速

VGGT-Editとは？テキスト指示で3Dシーンをフィードフォワード即時編集する新手法

中国の短編ドラマ産業がAIコンテンツ工場に変貌、1日470本・製作コスト最大90%削減

Warp-as-Historyとは？フリーズモデルで実現するゼロショットカメラ制御ビデオ生成

arXiv、AI任せ論文の著者を1年間投稿禁止へ — 学術AI利用規制が本格化

MemLensとは？789問で測るマルチモーダル長期記憶—最先端モデルも30%以下に留まる

Greg BrockmanがOpenAI製品戦略トップに就任、ChatGPTとCodexの統合計画が浮上

RefDecoderとは？参照フレーム注入で動画品質を最大+2.1dB向上させる新手法

OpenAI、マルタ政府と提携——全市民にChatGPT Plus、世界初の国家AI普及モデル

SDARとは？自己蒸留とRLの統合でLLMエージェント多ターン訓練を安定化する新手法

DatabricksがGPT-5.5採用、エンタープライズAIエージェントでOfficeQA Pro最高性能を達成

人気記事