AI-Papers | AI論文解説・ニュースブログ

AI最前線コラム

AI-PapersAI論文解説・ニュースブログ

検索運営者情報お問い合わせプライバシーポリシー利用規約

© 2026 AI-Papers. All rights reserved.

エージェントAIが「幼児期」に突入、自律システムの成熟に必要なガバナンスの変革とは

AI最前線コラム

エージェントAIが「幼児期」に突入、自律システムの成熟に必要なガバナンスの変革とは

MIT Technology ReviewのLynn Comp氏が、エージェントAIを「幼児期」に例えて自律AIガバナンスの課題を分析。権限管理・ゾンビエージェント・財務超過という構造的課題と対処策を体系的に把握できます。

2026年3月19日

GRP-Obliterationとは？ファインチューニングで15種類のLLMの安全訓練を無効化する攻撃手法をMicrosoftが公開

ニュース技術

GRP-Obliterationとは？ファインチューニングで15種類のLLMの安全訓練を無効化する攻撃手法をMicrosoftが公開

MicrosoftがGRP-Obliterationと呼ばれる攻撃手法を公開。強化学習を悪用してファインチューニングし、15種類のLLMの安全ガードレールを無効化できると実証し、対策を呼びかけています。

2026年3月16日

OpenSWEとは？45,320のDocker環境を自動合成しSWE-bench Verified 66%を達成する訓練基盤

論文解説データセット

OpenSWEとは？45,320のDocker環境を自動合成しSWE-bench Verified 66%を達成する訓練基盤

45,320個のDocker環境を自動合成し、SWE-bench Verifiedで66.0%を達成したオープンソースSWEエージェント訓練基盤「daVinci-Env」を紹介します。品質フィルタリングで抽出した9,000個の環境と完全公開されたインフラで、AI駆動型ソフトウェア開発の民主化を実現します。

2026年3月16日

Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング

ニュース技術

Absolicsのガラス基板とは？AIチップ性能を10倍高密度化する次世代パッケージング

韓国企業Absolicsが2026年にガラス基板の商業生産を開始します。配線密度10倍・反り解消など、AIチップパッケージングの根本課題を素材レベルで解決する技術の現状を解説します。

2026年3月15日

Neural Thickets：ランダム摂動だけでPPO/GRPOと互角なLLMポスト学習手法

論文解説言語・LLM

Neural Thickets：ランダム摂動だけでPPO/GRPOと互角なLLMポスト学習手法

事前学習済みモデルの重みの近傍には、タスク固有の専門家解が高密度に存在するという「Neural Thicket」現象を報告したMIT発の研究。ランダムサンプリングとアンサンブルのみでPPO・GRPOと同等性能を実現します。

2026年3月15日

論文解説マルチモーダル

DVDとは？ビデオ拡散モデルの生成的事前知識を深度推定に転用する世界初フレームワーク

事前学習済みビデオ拡散モデルを決定論的な深度回帰器に変換する世界初フレームワーク「DVD」を解説します。識別モデル比163倍少ないデータでNYUv2・KITTIなど複数ベンチマークのゼロショットSOTAを達成した3つの核心設計を紹介します。

2026年3月14日

DVDとは？ビデオ拡散モデルの生成的事前知識を深度推定に転用する世界初フレームワーク

AI最前線コラム

NVIDIAのAIエージェントがDABStep首位を獲得、再利用可能ツール生成の実践手法

NVIDIAのNeMo Agent Toolkitがデータ分析ベンチマークDABStepで首位を獲得。学習ループで再利用可能ツールを生成し、軽量モデルによる高速推論を実現した3フェーズ設計を解説します。

2026年3月13日

NVIDIAのAIエージェントがDABStep首位を獲得、再利用可能ツール生成の実践手法

前へ
1
2
…
32
次へ

論文解説強化学習

OpenClaw-RLとは？次状態信号から報酬を自動抽出し任意のRLエージェントを訓練する統合フレームワーク

Mengdi Wang氏らが提案するOpenClaw-RLは、ユーザー返答やツール出力などの次状態信号からPRMでスカラー報酬、OPDでトークン教師信号を自動抽出し、個人エージェント実験でパーソナライゼーションスコア0.81を達成したRLエージェント訓練フレームワークです。

2026年3月13日

OpenClaw-RLとは？次状態信号から報酬を自動抽出し任意のRLエージェントを訓練する統合フレームワーク

AI最前線コラム

Attention機構とは？Self-AttentionとMulti-Head Attentionの仕組みをわかりやすく図解

ChatGPTや画像生成AIを支えるAttention機構の仕組みを初心者向けに図解。Query・Key・Value、Self-Attention、Multi-Head AttentionからTransformer・LLMへの接続まで体系的に解説します。

2026年3月12日

Attention機構とは？Self-AttentionとMulti-Head Attentionの仕組みをわかりやすく図解

ニュース技術

楽天がOpenAI Codexで障害対応を2倍速に — MTTR50%削減、CI/CDレビュー自動化の実績

楽天グループはOpenAI Codexを本番環境に導入し、MTTRを50%削減。CI/CDの自動化とフルスタック自律開発により開発サイクルを1四半期から数週間に短縮した実績を紹介します。

2026年3月12日

楽天がOpenAI Codexで障害対応を2倍速に — MTTR50%削減、CI/CDレビュー自動化の実績

ニュースビジネス

ヤン・ルカン率いるAMI Labs、10億ドル超を調達。世界モデルでLLMの先を目指す

チューリング賞受賞者ヤン・ルカン氏が共同創業したAMI Labsが10億3000万ドルを調達しました。LLMを超える「世界モデル」の概念とJEPAアーキテクチャの狙いを解説します。

2026年3月10日

ヤン・ルカン率いるAMI Labs、10億ドル超を調達。世界モデルでLLMの先を目指す

論文解説マルチモーダル

Penguin-VLとは？CLIPを捨てLLM初期化ビジョンエンコーダでVLMの効率限界に挑む

Tencent AILabが提案するPenguin-VLは、CLIPなどの対比学習エンコーダを廃しLLM初期化のビジョンエンコーダを採用。DocVQAやChartQAなど文書・OCR系ベンチマークでQwen3-VLを上回る性能を2B規模で実現します。

2026年3月10日

Penguin-VLとは？CLIPを捨てLLM初期化ビジョンエンコーダでVLMの効率限界に挑む

カテゴリ

論文解説
ニュース
- 技術
- ビジネス
AI最前線コラム

人気記事

ゴールドマン・サックスがClaude AIを会計業務に導入 — 金融AI活用の最前線
2026年2月12日
AIエージェントフレームワーク比較【2026】LangGraph・CrewAI・OpenAI Agents SDKの選び方
2026年2月19日
NVIDIAが日本語特化LLM「Nemotron 2 Nano 9B」を公開 — ソブリンAI実現に向けた性能を解説
2026年2月18日
Step 3.5 Flashとは？110億パラメータでGPT-5.2級の性能を達成したオープンモデル
2026年2月13日
開発者向け検索AI「Phind 2」登場、視覚的検索強化！
2025年2月17日