TensorRT

2025年 5月 2日

借助 NVIDIA 在生产应用中集成和部署 Tongyi Qwen3 模型

阿里巴巴近期发布了其开源的混合推理大语言模型（LLM）通义千问 Qwen3，此次 Qwen3 开源模型系列包含两款混合专家模型 (MoE)…

3 MIN READ

2024年 7月 24日

借助最新 NVIDIA Merlin TensorFlow 插件实现大规模 Embedding 扩展

通过封装 NVIDIA Merlin HugeCTR，Sparse Operation Kit（以下简称 SOK）使得…

4 MIN READ

2024年 6月 11日

借助 NVIDIA TensorRT 轻量级引擎，为 AI 应用提供卓越性能和最小占用空间

NVIDIA TensorRT一个成熟的数据中心推理库，已迅速成为 NVIDIA GeForce RTX 和 NVIDIA RTX GPU…

2 MIN READ

2024年 6月 3日

NVIDIA 与 Hugging Face 合作，简化生成式 AI 模型部署

随着生成式 AI 的快速增长，社区通过两种重要方式加强了这种扩展：快速发布先进的基础模型，以及简化其与应用程序开发和生产的集成。

2 MIN READ

2024年 6月 2日

借助适用于 Windows RTX PC 的 NVIDIA RTX AI 工具包，简化 AI 驱动型应用的开发

NVIDIA 今日发布了 NVIDIA RTX AI 工具包，这是一个工具和 SDK 集合，

2 MIN READ

2024年 5月 30日

借助 Gipi、 NVIDIA TensortRT-LLM 和 AI 基础模型实现个性化学习

超过 1.2 亿人正在积极学习新语言，而 5 亿学习者正在数字学习平台（如 Duolingo）上学习。与此同时，全球很大一部分人口，

2 MIN READ

2024年 5月 14日

NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持

NVIDIA 今天宣布最新发布的 NVIDIA TensorRT，一个用于高性能深度学习推理的 API 生态系统。

2 MIN READ

2024年 5月 8日

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能，现已公开

在快速发展的环境中，生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长，

3 MIN READ

2024年 4月 2日

使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

大型语言模型 (LLM) 可以从大量文本中学习，并为各种任务和领域生成流畅、一致的文本，从而彻底改变自然语言处理 (NLP)。然而，

7 MIN READ

2024年 3月 19日

FP8：前沿精度与性能的新篇章

在深度学习和人工智能的快速发展背景下，尤其是大语言模型（Large Language Model, LLM）的蓬勃发展，

3 MIN READ

2024年 3月 18日

借助 NVIDIA NeMo Retriever，将企业数据转换为可行见解

在每个行业和每个工作职能部门，生成式 AI 正在激发组织内部的潜力，它将数据转化为知识，并使员工能够更高效地工作。

2 MIN READ

2024年 3月 7日

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术，将随机噪声逐步塑造为 AI 生成的艺术，

4 MIN READ

2024年 3月 7日

NVIDIA TensorRT 通过 8 位预训练量化将 Stable Diffusion 的速度提升近 2 倍

在生成式 AI 的动态领域，扩散模型脱颖而出，成为使用文本提示生成高质量图像的功能强大的架构 .

3 MIN READ

2024年 2月 1日

借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 编码助手

大型语言模型 (LLM) 的出现革新了人工智能领域，为与数字世界的交互提供了全新的方式。尽管 LLM 通常能够提供良好的通用解决方案，

4 MIN READ

2024年 1月 29日

使用全卷积网络在 Transformer 模型中模拟注意力机制

在过去十年中，深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石，展示了卓越的性能，

3 MIN READ

2024年 1月 16日

强大的场景文本检测和识别：简介

识别和识别自然场景和图像中的文本对于视频标题文本识别、检测车载摄像头的标牌、信息检索、场景理解、车牌识别以及识别产品文本等用例变得非常重要。

1 MIN READ