Best practice

2024年 8月 14日

NVIDIA NIM 微服务助力大规模 LLM 推理效率优化

随着大型语言模型 (LLMs) 继续以前所未有的速度发展，企业希望构建生成式 AI 驱动的应用程序，以最大限度地提高吞吐量，降低运营成本，

2 MIN READ

2024年 7月 31日

NVIDIA Nsight Graphics 帮助您轻松调试着色器

着色器是在 GPU 上运行的专用程序，可处理光线、像素、顶点和纹理，以实现独特的视觉效果。借助着色器，您可以为渲染的图像添加创意表达和真实感。

2 MIN READ

2024年 7月 24日

利用 OpenUSD 构建产品配置器

从广告公司到软件供应商的开发者都在助力全球品牌通过产品配置器解决方案为数字体验和视觉故事提供超个性化体验。

1 MIN READ

2024年 7月 9日

构建网络语言模型以解锁新的网络安全功能

通用型大型语言模型 (LLM) 已证明其在各个领域的效用，在文本生成和复杂问题解决等应用中提供了巨大的优势。但是，在某些情况下，

3 MIN READ

2024年 6月 27日

保护应用程序完整性的安全 LLM 令牌化解决方案

本文是 NVIDIA AI Red Team 持续漏洞和技术研究的一部分。NVIDIA AI Red Team’…

1 MIN READ

2024年 6月 12日

在 cuBLAS 中引入分组 GEMM API 以及更多性能更新

最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习（DL）和高性能计算（HPC）工作负载提供功能和性能。

2 MIN READ

2024年 5月 8日

使用 NVIDIA AI LangChain AI 端点构建 RAG 管道的提示

检索增强生成（RAG）是一种将信息检索与一组精心设计的系统提示相结合的技术，旨在从大型语言模型（LLM）中生成高质量的内容。

3 MIN READ

2024年 4月 29日

NVIDIA GTC 2024 的顶级数据科学会议现已按需提供

在 GTC 2024 上， NVIDIA 的专家和我们的合作伙伴分享了有关 GPU 加速工具、优化和数据科学家最佳实践的见解。

1 MIN READ

2024年 3月 20日

使用 NVIDIA Holoscan 1.0 开发生产就绪型 AI 传感器处理应用

边缘 AI 开发者正在为安全关键型和受监管用例构建 AI 应用和产品。借助 NVIDIA Holoscan 1.0，

2 MIN READ

2024年 3月 14日

强大的着色器见解：通过 NVIDIA Nsight Graphics 使用着色器调试信息

随着光线追踪成为现代游戏引擎中的主要渲染技术，单个 GPU RayGen 着色器现在可以执行帧的大部分光线模拟。为了管理这种复杂程度，

3 MIN READ

2024年 2月 21日

限制 CPU 线程以获得更好的游戏性能

许多 PC 游戏都围绕 8 核游戏机进行设计，并假设其软件线程系统在所有 PC 上都“正常工作”，尤其是在工作线程池中的线程数量方面。不久前，

1 MIN READ

2024年 1月 23日

借助 NVIDIA Quantum InfiniBand 简化 AI 网络运营

一个常见的技术误区是，性能和复杂性直接相关。也就是说，高性能的实现也是实现和管理最具挑战性的。但是，在考虑数据中心网络时，情况并非如此。

1 MIN READ

2024年 1月 5日

在某些场景中使用 cgroup 缩短 CUDA 初始化时间

在多 GPU 平台上运行的许多 CUDA 应用程序通常使用单个 GPU 来满足其计算需求。在这种情况下，应用程序会支付性能损失，

2 MIN READ

2023年 12月 15日

高级 API 性能：交换链

交换链是如何将渲染数据输出到屏幕的不可或缺的一部分。它们通常由一组输出就绪型缓冲区组成，每个缓冲区都可以旋转渲染为一个缓冲区。

1 MIN READ

2023年 11月 21日

高级 API 性能：内部函数

Intrinsics 可被视为特定硬件指令的更高级别的抽象。它们提供对低级操作或特定于硬件的功能的直接访问，从而提高性能。这样，

1 MIN READ

2023年 11月 15日

使用 NVIDIA IGX Orin 开发者套件在边缘部署大型语言模型

随着大型语言模型 (LLM) 功能变得更加强大，降低计算需求的技术也日趋成熟，因此出现了两个令人关注的问题。首先，

2 MIN READ