論文解説の記事一覧 (12ページ目)

論文解説言語・LLM

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

パイプライン並列化の「weight binding問題」を解消する新手法RoundPipeを解説します。GPUをステートレスなワーカープールとして扱うラウンドロビン方式で8×RTX 4090でのLLMファインチューニングを最大2.16倍高速化し、単一コンシューマーサーバーでQwen3-235BのLoRAチューニングを実現します。

2026年5月4日

論文解説

MARBLEとは？拡散モデルRL微調整で複数報酬を同時最適化する勾配ハーモナイゼーション手法

Stream-R1とは？信頼性と複雑度を考慮した報酬蒸留でストリーミング動画生成を向上させる新手法

OpenSearch-VLとは？マルチモーダル深層検索エージェントの完全公開訓練レシピを解説

長文脈LLMの不可能性三角形とは？Transformer・Mambaに課される根本的制約を解説

OpenSeeker-v2とは？SFTのみで産業界のRL学習パイプラインを超えた検索エージェント

ARISとは？敵対的マルチエージェント協調でML研究を自動化するオープンソースフレームワーク

PRISMとは？マルチモーダルRLの分布ドリフトをMoE対抗学習で解消する新手法

WeightFormerとは？Attentionを線形時間に置き換える動的MLP手法を解説

Ctx2Skillとは？マルチエージェント自己対戦でLLMのコンテキスト学習を強化する新手法

MolmoAct2とは？GPT-5・Gemini Roboticsを超えたオープンVLAモデルを解説

UniVidXとは？動画・アルベド・法線・RGBAを1モデルで統一生成する新手法

RoundPipeとは？コンシューマーGPU複数台でLLMファインチューニングを最大2.16倍高速化する新スケジューリング手法

人気記事