最近文章

2025年 7月 30日
大语言模型上车,软硬结合是关键
随着汽车行业的飞速发展,当乘用车从交通工具向智能移动终端不断进化,舱驾智能化水平已成为衡量整车厂竞争力的核心标尺,
3 MIN READ

2025年 7月 27日
NVIDIA TensorRT-LLM 支持腾讯混元最新大语言模型 Hunyuan-A13B 推理加速
腾讯混元 (Hunyuan) 最新大语言模型 Hunyuan-A13B 今日发布,NVIDIA TensorRT-LLM 作为全球领先的…
1 MIN READ

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理
将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ,
2 MIN READ

2025年 7月 23日
PDF 数据提取方法及其在信息检索中的应用
PDF 是共享财务报告、研究论文、技术文档和营销材料等信息的常用文件格式之一。然而,在构建有效的检索增强生成 (RAG) 系统时,
4 MIN READ

2025年 7月 22日
使用 NVIDIA Warp 和高斯抛物线法构建机器人心理模型
本文将探讨构建物理世界的动态数字表示的光明方向,这一主题在近期研究中日益受到关注。我们引入了一种在机器人环境中构建数字孪生的方法,
1 MIN READ

2025年 7月 22日
了解 NCCL 调优以加速 GPU 之间的通信
NVIDIA 集合通信库 (NCCL) 对于 AI 工作负载中的快速 GPU 到 GPU 通信至关重要,可使用各种优化和调优来提升性能。但是,
3 MIN READ

2025年 7月 22日
使用 NVIDIA NeMo 在一个周末内训练一个具备推理能力的 LLM
您是否曾想构建自己的推理模型,但认为它过于复杂或需要大量资源?再想想。借助 NVIDIA 强大的工具和数据集,
4 MIN READ

2025年 7月 21日
传统 RAG 与代理 RAG——AI 智能体如何通过动态知识实现更高智能
是否曾依赖不知道新高速公路旁路或道路突然关闭的旧 GPS?它可能会让您到达目的地,但不是最有效或最准确的方式。
1 MIN READ

2025年 7月 21日
使用 NVIDIA Nsight Systems 分析 Ray 负载(verl)的性能
在大语言模型的强化学习训练过程中,GPU 性能优化至关重要。随着模型规模不断扩大,
2 MIN READ

2025年 7月 18日
3 个 pandas 工作流在大型数据集上严重变慢,直到启用了 GPU 加速
如果您使用 pandas,您可能已经撞到了墙壁。正是在这个时刻,您值得信赖的工作流程在处理较小的数据集时表现出色,在处理大型数据集时陷入停顿。
1 MIN READ

2025年 7月 18日
使用 JAX 和 XLA 优化推理工作负载的低延迟通信
在生产环境中使用大语言模型 (LLM) 进行推理需要满足严格的延迟限制。此过程的关键阶段是 LLM 解码,
2 MIN READ

2025年 7月 18日
使用 Ansible 和 Git 实现 NVIDIA Air 网络设计自动化
NVIDIA Air 的核心是实现自动化。您可以对网络的每个部分进行编码和版本控制,并将其设置为自动触发。这包括创建拓扑、
2 MIN READ

2025年 7月 17日
使用 NVIDIA 安全配方保护代理式 AI 系统
随着大语言模型 (LLM) 驱动更多能够执行自主操作、工具使用和推理的代理式系统,企业被其灵活性和低推理成本所吸引。
2 MIN READ

2025年 7月 17日
大规模特征工程:利用 NVIDIA CUDA-X 数据科学优化半导体制造的机器学习模型
在上一篇博文中,我们介绍了芯片制造和运营中的预测建模设置,重点介绍了数据集不平衡等常见挑战,以及对更细致的评估指标的需求。
2 MIN READ

2025年 7月 17日
黑客松获奖者借助 NVIDIA NeMo Agent Toolkit 让代理式 AI 如生
学习新工具包的最佳方式是构建一些真实的东西,这正是开发者在最近的 NVIDIA NeMo Agent 工具包黑客松上所做的。在两周的时间里,
1 MIN READ

2025年 7月 16日
借助 NVIDIA Isaac 在医疗健康领域推动 AI 机器人开发
世界卫生组织预测,到 2030 年,全球将短缺外科医生、放射科医生和护士等 1500 多万医护人员。在美国,到 2034 年,
1 MIN READ