AI-Papers
Subquadratic、LLMの注意機構ボトルネックを突破 — FlashAttention比56倍高速化を主張 | AI-Papers