LLMs

2024年 2月 21日
构建由 LLM 提供支持的 API Agent 来执行任务
长期以来,开发者一直在构建 Web 应用程序等界面,使用户能够利用正在构建的核心产品。要了解如何在您的大型语言模型(LLM)…
3 MIN READ

2024年 2月 20日
构建 LLM 支持的数据代理以进行数据分析
AI 智能体是一个由规划功能、内存和工具组成的系统,用于执行用户请求的任务。对于数据分析或与复杂系统交互等复杂任务,
4 MIN READ

2024年 2月 5日
使用新的 NVIDIA AI 基础模型生成代码、回答查询并翻译文本
本周的 Model Monday 版本包含 NVIDIA 优化的代码 Lama、Kosmos-2 和 SeamlessM4T,
4 MIN READ

2024年 2月 1日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 编码助手
大型语言模型 (LLM) 的出现革新了人工智能领域,为与数字世界的交互提供了全新的方式。尽管 LLM 通常能够提供良好的通用解决方案,
4 MIN READ

2024年 1月 30日
使用现已推出 Beta 版的 NVIDIA AI Workbench 来创建、共享和扩展企业 AI 工作流程
NVIDIA AI Workbench 现已进入测试阶段,带来了丰富的新功能,可简化企业开发者创建、使用和共享 AI 和机器学习 (ML)…
3 MIN READ

2023年 12月 19日
2023 年最热门的 NVIDIA 技术博客文章:生成式 AI、LLM、机器人开发和虚拟世界的突破
在 NVIDIA 激动人心的又一年即将结束之际,是时候回顾 2023 年 NVIDIA 技术博客中最热门的案例了。 生成式 AI、
2 MIN READ

2023年 12月 18日
RAG 101:揭秘检索增强生成流程
大型语言模型 (LLM) 在理解和生成类似人类的响应方面具有前所未有的能力,这给世界留下了深刻的印象。
1 MIN READ

2023年 12月 18日
RAG 101:检索增强型生成问题
在设计和部署 RAG 工作流时,数据科学家、AI 工程师、MLOps 工程师和 IT 基础架构专业人员必须考虑各种因素:
2 MIN READ

2023年 12月 14日
生成式 AI 研究聚焦:揭开基于扩散的模型的神秘面纱
借助互联网级数据,AI 生成内容的计算需求显著增加,数据中心在数周或数月内全力运行单个模型,更不用说通常作为服务提供的高生成推理成本。
5 MIN READ

2023年 12月 13日
借助 NVIDIA H100 Tensor Core GPU 和 NVIDIA TensorRT-LLM 实现出色的推理性能
出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM,
2 MIN READ

2023年 12月 4日
新的 NVIDIA NeMo 框架功能和 NVIDIA H200 强效助力 LLM 训练性能和通用性
AI 在规模、复杂性和多样性方面的快速增长推动了对 大型语言模型 (LLM) 训练性能的不断需求。要提供出色的性能,
3 MIN READ

2023年 12月 4日
在 NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象
NVIDIA 今日公布了 NVIDIA Avatar Cloud Engine (ACE) 一系列技术,
1 MIN READ

2023年 12月 4日
如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型
大型语言模型正以其惊人的新能力推动人工智能的发展,扩大其应用范围。然而,由于这类模型具有庞大的参数规模,部署和推理的难度和成本极高,
2 MIN READ

2023年 11月 30日
构建您的首个 LLM 代理申请
在构建 大型语言模型 (LLM) 智能体应用时,您需要四个关键组件:智能体核心、内存模块、智能体工具和规划模块。无论您是设计问答智能体、
3 MIN READ

2023年 11月 30日
使用 NVIDIA 检索 QA 嵌入模型构建企业检索增强生成应用
大型语言模型 (LLM) 对人类语言和编程语言的深刻理解正在改变 AI 格局。对于新一代企业生产力应用程序而言,它们至关重要,
3 MIN READ