生成式人工智能/大语言模型

2025年 3月 10日
借助 NVIDIA DriveOS LLM SDK 简化自动驾驶汽车应用的 LLM 部署
大语言模型 (LLMs) 在自然语言处理 (NLP) 中表现出非凡的泛化能力。它们广泛应用于翻译、数字助理、推荐系统、上下文分析、代码生成、
2 MIN READ

2025年 3月 10日
在 NVIDIA DGX 云上确保模型训练可靠性
在大型 GPU 集群上训练 AI 模型给模型构建者带来了重大挑战。随着作业规模的增加,人工干预变得不切实际,
1 MIN READ

2025年 3月 7日
基于 1F1B 的 MoE A2A 通信计算 Overlap
在 MoE 模型的训练过程中,EP rank 之间的 A2A 通信在端到端时间中占据了相当大比重,对训练效率影响很大,
3 MIN READ

2025年 3月 6日
使用重排序微服务提升信息检索准确性和降低成本
需要高性能信息检索的应用涉及各个领域,包括搜索引擎、知识管理系统、AI 代理和 AI 助手。这些系统需要准确且计算高效的检索流程,
2 MIN READ

2025年 3月 3日
衡量 AI Guardrails 在生成式 AI 应用中的有效性和性能
保护 AI 智能体和其他对话式 AI 应用,以确保安全、品牌和可靠的行为,这对企业至关重要。
3 MIN READ

2025年 2月 28日
聚焦:NAVER Place 利用 NVIDIA TensorRT-LLM 优化 SLM 基础的垂直服务
NAVER 是一家韩国热门搜索引擎公司,提供 Naver Place ,这是一项基于地理的服务,可提供有关韩国数百万家企业和兴趣点的详细信息。
4 MIN READ

2025年 2月 28日
使用 DeepSeek-R1 NIM 构建具有专家推理功能的 AI 智能体
AI 智能体 正在通过实现流程自动化、优化决策制定和简化操作来改变业务运营。其有效性取决于专家推理,从而实现更明智的规划和高效执行。
2 MIN READ

2025年 2月 26日
图像和视频理解的视觉语言模型提示工程实践指南
视觉语言模型 (VLMs) 正在以极快的速度发展。2020 年,首批 VLMs 通过使用视觉编码器将视觉理解引入大语言模型 (LLMs) ,
4 MIN READ

2025年 2月 26日
借助适用于 LLM 的 NVIDIA NIM 微服务加速科学文献审查
精心设计的系统审查通常是研究人员探索科学领域的第一步。对于刚刚接触该领域的科学家,它提供了该领域的结构化概述。对于专家而言,
2 MIN READ

2025年 2月 26日
使用 NVIDIA NIM 构建基于 VLM 的简单多模态信息检索系统
在当今数据驱动的世界中,即使是从少量数据中检索准确信息的能力,对于寻求精简、有效的快速部署、原型设计或实验解决方案的开发者来说也至关重要。
3 MIN READ

2025年 2月 26日
在 NVIDIA GPU 上训练的 Microsoft Phi SLM 的多模态最新进展
大语言模型(LLMs)已渗透到各行各业,并改变了技术潜力。但是,由于规模庞大,它们对于许多公司目前面临的资源限制来说并不切实际。
1 MIN READ

2025年 2月 25日
定义 LLM 红色团队
在一项活动中,人们为生成式 AI 技术 (例如大语言模型 (LLMs)) 提供输入,以确定输出是否会偏离可接受的标准。
1 MIN READ

2025年 2月 25日
基于 Marco 多 AI 智能体框架的可配置图形任务求解在芯片设计中的应用
芯片和硬件设计因其复杂性和先进的技术而面临众多挑战。这些挑战导致在合成、验证、物理设计和可靠性循环期间优化性能、功耗、
2 MIN READ

2025年 2月 20日
借助全新的游戏内推理 SDK,将 NVIDIA ACE AI 角色引入游戏
NVIDIA ACE 是一套数字人技术,可借助生成式 AI 让游戏角色和数字助理如生。ACE 设备上模型为自主游戏角色提供代理工作流,
4 MIN READ

2025年 2月 20日
使用 Whisper 和 Canary 架构部署 NVIDIA Riva 多语种 ASR,同时选择性地停用 NMT
NVIDIA 持续开发自动语音识别 (ASR) 模型,这些模型在业内树立了基准。 早期版本的 NVIDIA Riva 是一种适用于 ASR 、
4 MIN READ