Posts by Ankit Patel
生成式人工智能/大语言模型
2025年 5月 2日
借助 NVIDIA 在生产应用中集成和部署 Tongyi Qwen3 模型
阿里巴巴近期发布了其开源的混合推理大语言模型(LLM)通义千问 Qwen3,此次 Qwen3 开源模型系列包含两款混合专家模型 (MoE)…
3 MIN READ
生成式人工智能/大语言模型
2024年 7月 25日
借助 Codestral Mamba 新一代编码 LLM 实现代码完成革新突破
在快速发展的生成式 AI 领域,编码模型已成为开发者不可或缺的工具,可提高软件开发的生产力和精度。它们通过自动执行复杂任务、
1 MIN READ
边缘计算
2024年 5月 20日
借助由 NVIDIA RTX GPU 优化的 Firebase Genkit 强效助力生成式 AI 开发
在 Google I/O 2024 大会上,Google 宣布了 Firebase Genkit,这是一个新的开源框架,
2 MIN READ
生成式人工智能/大语言模型
2024年 4月 22日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能
我们很高兴地宣布支持 Meta Llama 3 系列模型,通过 NVIDIA TensorRT LLM 加速和优化 LLM 推理性能。
2 MIN READ
数据中心/云端
2024年 2月 21日
NVIDIA TensorRT-LLM 为 Google Gemma 加速推理
作为发布合作伙伴,NVIDIA 与 Google 合作提供了Gemma,这是一个新优化的开放模型系列,
1 MIN READ
生成式人工智能/大语言模型
2023年 9月 8日
NVIDIA TensorRT-LLM 在 NVIDIA H100 GPU 上大幅提升大语言模型推理能力
大语言模型(LLM)提供异常强大的新功能,拓展了 AI 的应用领域。但由于其庞大的规模和独特的执行特性,很难找到经济高效的使用方式。
3 MIN READ