生成型人工智能

2025年 2月 13日
使用 DeepSeek-R1 和推理时间缩放实现自动化 GPU 内核生成
随着 AI 模型扩展其功能以解决更复杂的挑战,一种称为“ 测试时扩展 ”或“ 推理时扩展 ”的新扩展法则正在出现。
2 MIN READ

2025年 2月 12日
使用 NVIDIA NeMo 框架进行 LLM 模型剪枝和知识蒸馏
模型剪枝和知识蒸馏是功能强大且经济高效的策略,用于从最初较大的同级获得较小的语言模型。 在一篇“ 如何剪枝和蒸馏 Llama-3.1 8B ”…
4 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 2月 5日
使用 NVIDIA AI Workbench 简化本地和云系统之间的协作
NVIDIA AI Workbench 是一款免费的开发环境管理器 ,用于在 GPUs 上开发、定制 AI 应用并对其进行原型设计。
3 MIN READ

2025年 2月 5日
NVIDIA Blackwell 上的 OpenAI Triton 提升 AI 性能和可编程性
矩阵乘法和注意力机制是现代 AI 工作负载的计算支柱。虽然库如 NVIDIA cuDNN 提供高度优化的实现,
2 MIN READ

2025年 2月 5日
利用特定领域的微调和 NVIDIA NIM 提高翻译质量
翻译在助力公司实现跨国业务扩展方面发挥着至关重要的作用,在语调、准确性和技术术语处理方面的要求差异很大。
3 MIN READ

2025年 1月 30日
为 NVIDIA Blackwell GeForce RTX 50 系列 GPU 发布全新 AI SDK 和工具
NVIDIA 最近宣布推出 新一代 PC GPU – GeForce RTX 50 系列 ,以及面向开发者的全新 AI 赋能 SDK 和工具。
2 MIN READ

2025年 1月 30日
如何借助 NVIDIA Streamline 将 NVIDIA DLSS 4 集成到您的游戏中
NVIDIA DLSS 4 是 NVIDIA GeForce RTX 50 系列 GPU 中引入的 DLSS 的最新版本。它包含多项新功能:
3 MIN READ

2025年 1月 29日
掌握 LLM 技术:评估
评估大语言模型(LLMs) 和 检索增强生成(RAG) 系统是一个复杂而微妙的过程,反映了这些系统的复杂性和多面性。 与传统机器学习(ML)…
2 MIN READ

2025年 1月 24日
动态内存压缩技术
尽管大语言模型(LLMs)作为通用 AI 工具取得了成功,但其对计算资源的高需求使其在许多真实场景中的部署具有挑战性。
3 MIN READ

2025年 1月 22日
在 Kubernetes 上实现 NVIDIA NIM 微服务的水平自动缩放
NVIDIA NIM 微服务是可部署在 Kubernetes 上的模型推理容器。在生产环境中,
3 MIN READ

2025年 1月 21日
构建 AI 销售助理的经验教训
在 NVIDIA,销售运营团队为销售团队提供将先进的硬件和软件推向市场所需的工具和资源。
3 MIN READ

2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ

2025年 1月 16日
如何使用 NVIDIA NeMo Guardrails 为客户服务保护 AI 智能体
AI 代理为 企业扩展和提升客户服务以及支持交互提供了重要机会。这些客服人员可自动处理日常查询并缩短响应时间,从而提高效率和客户满意度,
5 MIN READ

2025年 1月 16日
NVIDIA JetPack 6.2 为 NVIDIA Jetson Orin Nano 和 Jetson Orin NX 模块引入超级模式
NVIDIA Jetson Orin Nano 超级开发者套件 的推出为小型边缘设备开启了 生成式 AI 的新时代。
7 MIN READ

2025年 1月 16日
在 NVIDIA TensorRT-LLM 中引入新型 KV 缓存重用优化策略
语言模型通过预测下一个令牌 (给定所有先前的令牌,包括输入文本令牌) 来生成文本。在 LLM 服务中,先前令牌的键和值元素用作历史语境,
2 MIN READ