Benchmark
2024年 7月 17日
NVIDIA NeMo 借助混合状态空间模型加速 LLM 创新发展
当今的大型语言模型(LLM)基于 2017 年推出的 Transformer 模型架构。自那时以来,
2 MIN READ
2024年 6月 12日
NVIDIA 在 MLPerf Training v4.0 中创造了新的生成式 AI 性能和规模记录
生成式 AI 模型具有多种用途,例如帮助编写计算机代码、创作故事、作曲、生成图像、制作视频等。而且,随着这些模型的大小不断增加,
3 MIN READ
2024年 6月 10日
NVIDIA 文本嵌入模型位列 MTEB 排行榜榜首
NVIDIA 的最新嵌入模型NV-Embed- 以 69.32 的分数创下了嵌入准确率的新纪录海量文本嵌入基准测试 (MTEB)涵盖 56…
2 MIN READ
2024年 4月 29日
GPU 驱动的 Windows 365 云 PC 与 NVIDIA RTX 虚拟工作站,用于高端图形工作负载
随着对图形密集型场景的需求增加,专业工作流程变得更加复杂。从常规的办公应用程序到高要求的制造、建筑、工程以及媒体和娱乐应用程序,
2 MIN READ
2024年 4月 3日
使用 WholeGraph 优化图形神经网络的内存和检索,第 2 部分
大规模图形神经网络 (GNN) 训练带来了艰巨的挑战,特别是在图形数据的规模和复杂性方面。这些挑战不仅涉及神经网络的正向和反向计算的典型问题,
2 MIN READ
2024年 3月 27日
NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录
随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型,
3 MIN READ
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
2024年 3月 18日
RAPIDS cuDF 可将 pandas 加速近 150 倍,且无需更改代码
在 NVIDIA GTC 2024 上,我们宣布 RAPIDS cuDF 现在可以为 950 万 Pandas 用户带来 GPU 加速,
2 MIN READ
2024年 3月 18日
借助加速以太网网络和网络存储扩展企业 RAG
在生成式人工智能中,机器不仅可以从数据中学习,还可以生成类似人类的文本、图像、视频等。检索增强生成 (RAG) 是一种突破性的方法。
2 MIN READ
2024年 3月 5日
NVIDIA RTX 500 和 1000 Ada Generation 笔记本电脑 GPU 可随时随地驱动 AI 增强型工作流
轻薄设计为专业人士提供先进的 AI、计算和图形处理能力。 随着生成式 AI 和混合工作环境成为新标准,无论是内容创作者、研究人员还是工程师,
1 MIN READ
2023年 2月 9日
通过 GROMACS 大幅提高多节点 NVIDIA GPU 的可扩展性
GROMACS 是一种广泛用于模拟生物分子系统的科学软件包,在理解对疾病预防和治疗重要的重要生物学过程中发挥着至关重要的作用。
3 MIN READ
2023年 2月 2日
针对 NVIDIA GPU 的低延迟交易和快速回测的深度神经网络基准
降低对新市场事件的响应时间是算法交易的一个驱动力。对延迟敏感的交易公司通过在其系统中部署诸如现场可编程门阵列( FPGA )和专用集成电路(…
2 MIN READ
2022年 11月 9日
领先的 MLPerf Training 2.1 ,具有针对 AI 的全栈优化
MLCommons 开发的 MLPerf 基准是组织衡量其机器学习模型跨工作负载培训性能的关键评估工具。
4 MIN READ
2022年 6月 30日
为 NVIDIA MLPerf Training v2.0 性能提供动力的全堆栈优化
MLPerf benchmarks 由工业界、学术界和研究实验室的人工智能领导者组成的联盟开发,旨在提供标准、公平和有用的深度学习性能测量。
4 MIN READ
2022年 6月 1日
通过全栈创新推动高性能计算
高性能计算(HPC)已成为科学发现的基本工具。 无论是发现新的拯救生命的药物,对抗气候变化,还是创建精确的世界模拟,
3 MIN READ
2022年 4月 6日
在 MLPerf 推理 2.0 上获得最佳性能
Megatron 530B 等机型正在扩大人工智能可以解决的问题范围。然而,随着模型的复杂性不断增加,它们对人工智能计算平台构成了双重挑战:
4 MIN READ