金国强

金国强是 NVIDIA 解决方案架构师,主要负责深度学习生成式 AI 领域模型训练、推理以及大模型应用云端落地等技术方向合作。

Posts by 金国强

模型/库/框架

在魔搭社区使用 NVIDIA TensorRT-LLM PyTorch 新架构优化 Qwen3 系列模型推理

摘要: TensorRT-LLM 采用 PyTorch 全新架构进一步优化模型部署流程,提升开发者使用体验。 2 MIN READ
生成式人工智能/大语言模型

在阿里云 PAI 上一键部署和使用 NVIDIA Cosmos Reason-1 模型

NVIDIA 近期发布了 Cosmos Reason-1 的 7B 和 56B 两款多模态大语言模型 (MLLM),它们经过了“物理 AI… 3 MIN READ
Uncategorized

使用 NVIDIA NIM 在阿里云容器服务(ACK)中加速 LLM 推理

大语言模型(LLM)是近年来发展迅猛并且激动人心的热点话题,引入了许多新场景,满足了各行各业的需求。随着开源模型能力的不断增强, 4 MIN READ