FlashInfer:LLM 服务的内核库
FlashInfer:LLM 服务的内核库
最近更新:2024-12-28 13:18
1.6k
星数
Cuda
主语言
活跃
Apache License 2.0
协议
30
贡献者
组织
0.2.0.post1
最新版本
163
Forks
52
Issues
1.6k
Watch
2023
创建年份
公开
FlashInfer: Kernel Library for LLM Serving