動画 動画の細粒度認識のための半教師あり学習手法「SeFAR」
動画データに基づく細粒度動作認識のための新しい半教師あり学習フレームワーク「SeFAR」を提案。ラベル付きとラベルなしデータを活用し、高精度な擬似ラベル生成で性能向上を実現。実験で最先端手法を超え、計算コストやモデルサイズも低減を達成。
動画
言語・LLM
動画
マルチモーダル
言語・LLM
言語・LLM
データセット
ニュース
ニュース
ニュース