Posts by 邵将
加速计算
2024年 1月 15日
使用 NVIDIA TensorRT-LLM 支持 CodeFuse-CodeLlama-34B 上的 int4 量化和推理优化实践
Codefuse(https://github.com/codefuse-ai)是由蚂蚁集团开发的代码语言大模型,
3 MIN READ