Advanced Technical
2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ
2024年 9月 24日
借助 NVIDIA NeMo 实现出色的 ASR 模型 10 倍加速
NVIDIA NeMo 持续开发了设定行业基准的 自动语音识别(ASR) 模型,尤其是在 Hugging Face Open ASR 排行榜…
4 MIN READ
2024年 9月 18日
使用 NVIDIA NIM 微服务实现语音和翻译功能,快速赋予应用语音能力
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自行托管的 GPU 加速推理微服务提供容器,用于跨云、
3 MIN READ
2024年 9月 6日
在电路设计中使用生成式 AI 模型
从智能文本生成大语言模型(LLMs)到创意图像和视频生成模型,生成式模型在过去几年中掀起了巨大的浪潮。在 NVIDIA,
2 MIN READ
2024年 6月 28日
推出高性能微调解决方案 DoRA,LoRA 的替代选择
全微调(FT)通常用于针对特定的下游任务定制通用预训练模型。为了降低训练成本,我们引入了参数高效微调(PEFT)方法,
3 MIN READ
2024年 6月 14日
通过五门新的 NVIDIA 技术课程提升您的技能
随着人工智能以前所未有的速度引入技术创新,保持领先意味着保持你的技能与时俱进。NVIDIA 开发者计划为您提供所需的工具、培训和资源,
1 MIN READ
2024年 6月 12日
NVIDIA 在 MLPerf Training v4.0 中创造了新的生成式 AI 性能和规模记录
生成式 AI 模型具有多种用途,例如帮助编写计算机代码、创作故事、作曲、生成图像、制作视频等。而且,随着这些模型的大小不断增加,
3 MIN READ
2024年 4月 22日
借助 NVIDIA AI 基础模型 VISTA-2D 推进细胞分割和形态分析
基因组学研究人员使用不同的测序技术来更好地理解生物系统,包括单细胞和空间组学。与从细胞层面查看数据的单细胞不同,空间组学考虑了数据的位置,
2 MIN READ
2024年 4月 2日
使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM
大型语言模型 (LLM) 可以从大量文本中学习,并为各种任务和领域生成流畅、一致的文本,从而彻底改变自然语言处理 (NLP)。然而,
7 MIN READ
2024年 3月 27日
NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录
随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型,
3 MIN READ
2024年 3月 21日
重新思考如何训练 Diffusion 模型
在探索了扩散模型采样、参数化和训练的基础知识之后,我们的团队开始研究这些网络架构的内部结构。请参考 生成式 AI 研究聚焦:
2 MIN READ
2024年 3月 14日
在 LLM 架构中应用多专家模型
多专家模型 (MoE) 大型语言模型 (LLM) 架构最近出现了,无论是在 GPT-4 等专有 LLM 中,还是在开源版本的社区模型中,
3 MIN READ
2024年 2月 6日
生成式 AI 研究聚焦:个性化文本转图像模型
视觉效果生成式 AI是一个根据文本提示创建图像的过程。该技术基于在互联网规模的数据上预训练的视觉语言基础模型。通过提供多模态表示,
2 MIN READ
2024年 1月 29日
使用全卷积网络在 Transformer 模型中模拟注意力机制
在过去十年中,深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石,展示了卓越的性能,
3 MIN READ
2024年 1月 23日
借助 NVIDIA Metropolis 微服务和 API 构建边缘视觉 AI 应用
通过 NVIDIA Metropolis 微服务,开发者可以利用功能强大的云原生 API 和微服务来构建和定制视觉 AI 应用和解决方案。
4 MIN READ
2023年 12月 14日
生成式 AI 研究聚焦:揭开基于扩散的模型的神秘面纱
借助互联网级数据,AI 生成内容的计算需求显著增加,数据中心在数周或数月内全力运行单个模型,更不用说通常作为服务提供的高生成推理成本。
5 MIN READ