AI-Papers
Tensor Product Attention(TPA)とは?Transformerのメモリ効率を改善する新手法 | AI-Papers