解説する論文 タイトル: Splitwise: Efficient Generative LLM Inference Using Phase Splitting 著者: Pratyush Patel, Esha Choukse, Chaojie Zhang, Íñigo Goiri, Aashaka Shah, Saeed Maleki, Ricardo Bianchini 論文のURL: https://arxiv.org/pdf/2311.…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。