Posts by 金国强
模型/库/框架
2025年 6月 26日
在魔搭社区使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理
摘要: TensorRT-LLM 采用 PyTorch 全新架构进一步优化模型部署流程,提升开发者使用体验。
2 MIN READ
生成式人工智能/大语言模型
2025年 5月 30日
在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型
NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI…
3 MIN READ
Uncategorized
2024年 9月 2日
使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理
大语言模型(LLM)是近年来发展迅猛并且激动人心的热点话题,引入了许多新场景,满足了各行各业的需求。随着开源模型能力的不断增强,
4 MIN READ