性能向上

言語・LLM

ユーザー適応型LLM:新手法TPOで再学習不要

ユーザーの好みに合わせてLLMの出力を調整する新手法TPOを提案テスト時にユーザーのフィードバックを活用し、損失関数を用いた出力の最適化TPOは再トレーニング不要でコスト削減を実現しながら競争力を持つ性能論文:Test-Time Prefe...
言語・LLM

専門家負荷均等化で効率改善:LBLの提案

新しいLoad-balancing Loss(LBL)を導入し、Mixture-of-Expertsモデルの専門家間の負荷を均等化。LBLにより、トークンの利用が均等となり、性能とリソース分配が改善され、効率的な学習プロセスに貢献。
言語・LLM

進化的アルゴリズムでLLMの能力向上を図る方法

進化的アルゴリズムを用いた「Mind Evolution」でLLMの問題解決能力を向上!島型モデルを採用し、解の生成と進化で成功率と効率性を実証。複雑なタスクでの性能向上が期待されます。
ニュース

xAI、「Grok 3」発表! GPT-4o超えの性能も

xAIが新モデル「Grok 3」を発表!「Grok 3 Reasoning」や「DeepSearch」が追加され、高性能を実現。Xプレミアムプラス会員に提供中で、「SuperGrok」プランも利用可能。次世代モデル開発進行中!
マルチモーダル

【Baichuan-Omni-1.5】画像・音声・テキストを統合するマルチモーダルモデル

Baichuan-Omni-1.5は画像・音声・テキストを統合的に扱うマルチモーダルモデル。Visual BranchとAudio Branchを活用し、多様なデータを高精度に処理。実験では従来モデルを上回る性能を多数のベンチマークで示した。
強化学習

LLM性能向上手法「REINFORCE++」がPPOを超える效果!

REINFORCE++は、トークンレベルのKL正則化と簡素な方策更新を用いて、LLMの性能を向上させる手法です。PPOに匹敵する一般化性能とコスト効率を実験で示しています。
マルチモーダル

長い思考指示と知識蒸留で視覚タスク性能を向上したMLLM「Virgo」の提案

視覚推論力を向上させるMLLM「Virgo」が登場!長い思考指示と知識蒸留の2アプローチで性能向上を実証。データの質が結果に及ぼす影響も重要と確認。
強化学習

ロボット予測操作と計算最適化の新枠組みEnerVerse

新しいフレームワーク「EnerVerse」は、ロボットの未来状態予測と操作指令生成を統合。技術「Chunk Diffusion」と「Free Anchor View」で予測の不連続や空間欠落を解消し、Sparse Memoryで計算資源を節約しつつ高性能を実証。
動画

動画の細粒度認識のための半教師あり学習手法「SeFAR」

動画データに基づく細粒度動作認識のための新しい半教師あり学習フレームワーク「SeFAR」を提案。ラベル付きとラベルなしデータを活用し、高精度な擬似ラベル生成で性能向上を実現。実験で最先端手法を超え、計算コストやモデルサイズも低減を達成。
言語・LLM

SSMの長期依存タスクの性能向上を実現する新手法

SSMの情報依存と均一化問題を解明し、情報活用のための極性化手法を提案。長期依存性タスクでの性能向上を実証し、効果的な手法を確立。情報処理の効率化に貢献。