AI-Papers
Sumiとは?1.5兆トークンで訓練した7B Uniform拡散言語モデルが自己回帰モデルと同等性能を達成 | AI-Papers