AI 基础模型

2025年 3月 27日
R²D²:利用 NVIDIA Research 的新型工作流和AI基础模型提升机器人移动能力和全身控制
欢迎阅读第一版 NVIDIA 机器人研发摘要 (R2D2) 。此技术博客系列将为开发者和研究人员提供更深入的见解,
3 MIN READ

2025年 3月 18日
加速通用人形机器人的开发:NVIDIA Isaac GR00T N1
人形机器人需要能够适应人类工作空间,处理重复性或高强度任务。然而,为真实世界的任务和不可预测的环境创建通用人形机器人是一项挑战。通常来说,
2 MIN READ

2025年 3月 12日
轻量级、多模态、多语种 Gemma 3 模型实现性能优化
使用基础模型构建 AI 系统需要在内存、延迟、存储、计算等资源之间实现微妙的平衡。在将生成式 AI 功能引入快速发展的 AI 应用生态系统时,
1 MIN READ

2025年 2月 26日
在 NVIDIA GPU 上训练的 Microsoft Phi SLM 的多模态最新进展
大语言模型(LLMs)已渗透到各行各业,并改变了技术潜力。但是,由于规模庞大,它们对于许多公司目前面临的资源限制来说并不切实际。
1 MIN READ

2025年 2月 11日
NVIDIA DGX 云推出即用型模板,更好地评估 AI 平台性能
在快速发展的 AI 系统和工作负载环境中,实现出色的模型训练性能远远超出芯片速度。这需要对整个堆栈进行全面评估,从计算到网络,再到模型框架。
2 MIN READ

2025年 1月 6日
Llama Nemotron 模型提升智能体 AI 工作流的准确性和效率
Agentic AI 是新一波生成式 AI 浪潮,是一种范式转变,通过使 AI 系统能够自主行动并实现复杂的目标,具有变革行业的潜力。
2 MIN READ

2024年 12月 18日
NVIDIA TensorRT-LLM 现支持 Recurrent Drafting,实现 LLM 推理优化
Recurrent Drafting (简称 ReDrafter) 是苹果公司为大语言模型 (LLM) 推理开发并开源的一种新型推测解码技术,
2 MIN READ

2024年 12月 17日
利用 NVIDIA NeMo-Aligner 进行监督式微调的数据高效知识蒸馏
知识蒸馏是一种将更大的教师模型的知识转移到更小的学生模型的方法,理想情况下可生成紧凑、易于部署的学生,且准确度与教师相当。
2 MIN READ

2024年 11月 21日
聚焦:借助 AVEVA 动态模拟和 NVIDIA Raptor 推进自动驾驶操作
工业工程师正在利用人工智能构建先进的流程模拟解决方案,并加快能源、电力和化学行业实现完全自主运营的进程。
2 MIN READ

2024年 11月 21日
利用 NVIDIA NIM 实现 AI 模型微调部署
对于使用特定领域数据调整 AI 基础模型的组织而言,快速创建和部署微调模型的能力是高效地通过企业生成式 AI 应用提供价值的关键。
2 MIN READ

2024年 11月 19日
Llama 3.2 全栈优化释放 NVIDIA GPU 的高性能
Meta 最近发布了 Llama 3.2 系列视觉语言模型(VLM),其中包含 11B 参数和 90B 参数变体。这些模型是多模态模型,
2 MIN READ

2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初发布于 2024 年 8 月 21 日,但已根据当前数据进行了修订。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ

2024年 10月 3日
新的奖励模型有助于改善 LLM 与人类偏好的匹配
从人类反馈中进行强化学习(Reinforcement learning from human…
1 MIN READ

2024年 9月 25日
Llama 3.2 加速部署从边缘到云端实现提速
扩展开源 Meta Llama 模型集合,Llama 3.2 集合包括视觉语言模型(VLM)、小语言模型(SLM)和更新版的 Llama…
2 MIN READ

2024年 8月 21日
Mistral-NeMo-Minitron 8B 基础模型实现准确性巅峰
上个月,NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B,这是一款领先的先进的大型语言模型(LLM)。
1 MIN READ

2024年 7月 29日
利用 NVIDIA Isaac 实验室加速机器人模拟学习
机器人需要具备适应能力,能够随时学习新技能并适应周围环境。然而,传统训练方法可能会限制机器人在新情况下应用所学技能的能力,
2 MIN READ