LLMs

2024年 2月 21日

构建由 LLM 提供支持的 API Agent 来执行任务

长期以来，开发者一直在构建 Web 应用程序等界面，使用户能够利用正在构建的核心产品。要了解如何在您的大型语言模型(LLM)…

3 MIN READ

2024年 2月 20日

构建 LLM 支持的数据代理以进行数据分析

AI 智能体是一个由规划功能、内存和工具组成的系统，用于执行用户请求的任务。对于数据分析或与复杂系统交互等复杂任务，

4 MIN READ

2024年 2月 5日

使用新的 NVIDIA AI 基础模型生成代码、回答查询并翻译文本

本周的 Model Monday 版本包含 NVIDIA 优化的代码 Lama、Kosmos-2 和 SeamlessM4T，

4 MIN READ

2024年 2月 1日

借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 编码助手

大型语言模型 (LLM) 的出现革新了人工智能领域，为与数字世界的交互提供了全新的方式。尽管 LLM 通常能够提供良好的通用解决方案，

4 MIN READ

2024年 1月 30日

使用现已推出 Beta 版的 NVIDIA AI Workbench 来创建、共享和扩展企业 AI 工作流程

NVIDIA AI Workbench 现已进入测试阶段，带来了丰富的新功能，可简化企业开发者创建、使用和共享 AI 和机器学习 (ML)…

3 MIN READ

2024年 1月 9日

在 GPU 上高效部署语音 AI 模型

导读：本文将介绍如何在GPU上高效地部署语音AI模型，主要内容如下：

3 MIN READ

2023年 12月 19日

2023 年最热门的 NVIDIA 技术博客文章：生成式 AI、LLM、机器人开发和虚拟世界的突破

在 NVIDIA 激动人心的又一年即将结束之际，是时候回顾 2023 年 NVIDIA 技术博客中最热门的案例了。生成式 AI、

2 MIN READ

2023年 12月 18日

RAG 101：揭秘检索增强生成流程

大型语言模型 (LLM) 在理解和生成类似人类的响应方面具有前所未有的能力，这给世界留下了深刻的印象。

1 MIN READ

2023年 12月 18日

RAG 101：检索增强型生成问题

在设计和部署 RAG 工作流时，数据科学家、AI 工程师、MLOps 工程师和 IT 基础架构专业人员必须考虑各种因素：

2 MIN READ

2023年 12月 14日

生成式 AI 研究聚焦：揭开基于扩散的模型的神秘面纱

借助互联网级数据，AI 生成内容的计算需求显著增加，数据中心在数周或数月内全力运行单个模型，更不用说通常作为服务提供的高生成推理成本。

5 MIN READ

2023年 12月 13日

借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 实现出色的推理性能

出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM，

2 MIN READ

2023年 12月 4日

新的 NVIDIA NeMo 框架功能和 NVIDIA H200 强效助力 LLM 训练性能和通用性

AI 在规模、复杂性和多样性方面的快速增长推动了对大型语言模型 (LLM) 训练性能的不断需求。要提供出色的性能，

3 MIN READ

2023年 12月 4日

在 NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象

NVIDIA 今日公布了 NVIDIA Avatar Cloud Engine (ACE) 一系列技术，

1 MIN READ

2023年 12月 4日

如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

大型语言模型正以其惊人的新能力推动人工智能的发展，扩大其应用范围。然而，由于这类模型具有庞大的参数规模，部署和推理的难度和成本极高，

2 MIN READ

2023年 11月 30日

构建您的首个 LLM 代理申请

在构建大型语言模型 (LLM) 智能体应用时，您需要四个关键组件：智能体核心、内存模块、智能体工具和规划模块。无论您是设计问答智能体、

3 MIN READ

2023年 11月 30日

使用 NVIDIA 检索 QA 嵌入模型构建企业检索增强生成应用

大型语言模型 (LLM) 对人类语言和编程语言的深刻理解正在改变 AI 格局。对于新一代企业生产力应用程序而言，它们至关重要，

3 MIN READ