Benchmark
2024年 4月 3日
使用 WholeGraph 优化图形神经网络的内存和检索,第 2 部分
大规模图形神经网络 (GNN) 训练带来了艰巨的挑战,特别是在图形数据的规模和复杂性方面。这些挑战不仅涉及神经网络的正向和反向计算的典型问题,
2 MIN READ
2024年 3月 27日
NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录
随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型,
3 MIN READ
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
2024年 3月 18日
RAPIDS cuDF 可将 pandas 加速近 150 倍,且无需更改代码
在 NVIDIA GTC 2024 上,我们宣布 RAPIDS cuDF 现在可以为 950 万 Pandas 用户带来 GPU 加速,
2 MIN READ
2024年 3月 18日
借助加速以太网网络和网络存储扩展企业 RAG
在生成式人工智能中,机器不仅可以从数据中学习,还可以生成类似人类的文本、图像、视频等。检索增强生成 (RAG) 是一种突破性的方法。
2 MIN READ
2024年 3月 5日
NVIDIA RTX 500 和 1000 Ada Generation 笔记本电脑 GPU 可随时随地驱动 AI 增强型工作流
轻薄设计为专业人士提供先进的 AI、计算和图形处理能力。 随着生成式 AI 和混合工作环境成为新标准,无论是内容创作者、研究人员还是工程师,
1 MIN READ
2023年 2月 9日
通过 GROMACS 大幅提高多节点 NVIDIA GPU 的可扩展性
GROMACS 是一种广泛用于模拟生物分子系统的科学软件包,在理解对疾病预防和治疗重要的重要生物学过程中发挥着至关重要的作用。
3 MIN READ
2023年 2月 2日
针对 NVIDIA GPU 的低延迟交易和快速回测的深度神经网络基准
降低对新市场事件的响应时间是算法交易的一个驱动力。对延迟敏感的交易公司通过在其系统中部署诸如现场可编程门阵列( FPGA )和专用集成电路(…
2 MIN READ
2022年 11月 9日
领先的 MLPerf Training 2.1 ,具有针对 AI 的全栈优化
MLCommons 开发的 MLPerf 基准是组织衡量其机器学习模型跨工作负载培训性能的关键评估工具。
4 MIN READ
2022年 6月 30日
为 NVIDIA MLPerf Training v2.0 性能提供动力的全堆栈优化
MLPerf benchmarks 由工业界、学术界和研究实验室的人工智能领导者组成的联盟开发,旨在提供标准、公平和有用的深度学习性能测量。
4 MIN READ
2022年 6月 1日
通过全栈创新推动高性能计算
高性能计算(HPC)已成为科学发现的基本工具。 无论是发现新的拯救生命的药物,对抗气候变化,还是创建精确的世界模拟,
3 MIN READ
2022年 4月 6日
在 MLPerf 推理 2.0 上获得最佳性能
Megatron 530B 等机型正在扩大人工智能可以解决的问题范围。然而,随着模型的复杂性不断增加,它们对人工智能计算平台构成了双重挑战:
4 MIN READ
2022年 3月 1日
使用最新的由 NVIDIA 驱动的实例,在云端节省时间和金钱
人工智能正在改变每一个行业,实现传统软件无法实现的强大的新应用程序和用例。随着人工智能的不断扩散,以及人工智能模型的规模和复杂性的不断增加,
4 MIN READ
2021年 12月 1日
通过全堆栈优化提升 NVIDIA MLPerf Training v1.1 的性能
自 v1.0 以来已经过去了五个月,所以是时候进行新一轮 MLPerf 培训基准了。在这个 v1.1 版本中,
5 MIN READ