高性能计算

2024年 4月 19日

利用 NVIDIA Merlin HierarchicalKV 实现唯品会在搜推广场景中的 GPU 推理实践

本实践中，唯品会 AI 平台与 NVIDIA 团队合作，结合 NVIDIA TensorRT 和 NVIDIA Merlin…

2 MIN READ

2022年 8月 23日

NVIDIA Grace CPU 内部：NVIDIA 为 HPC 和 AI 加强超级芯片工程

NVIDIA Grace CPU 是 NVIDIA 开发的第一个数据中心 CPU 。它是从头开始建造的，以创建世界上第一个超级芯片 .

4 MIN READ

2022年 5月 19日

腾讯广告视频抽帧的全流程 GPU 加速

腾讯广告的开发人员改进了视频抽帧的实现方式，使得全流程的操作均在 GPU 上完成，取代了原有的 CPU 抽帧流程，提高了性能，并降低了成本。

4 MIN READ

2022年 5月 19日

NVIDIA A100 加速医学图像处理深度学习研究

本案例中通过 NVIDIA A100 GPU 加速器，上海市磁共振重点实验室构建了高效的深度学习科研硬件平台，

1 MIN READ

2022年 1月 27日

多节点多 GPU ：大规模使用 NVIDIA cuFFTMp FFT

今天，NVIDIA 宣布发布 Early Access （ EA ）的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多节点、

4 MIN READ

2022年 1月 27日

使用最新的 Nsight Compute 进行高级内核评测

NVIDIA Nsight Compute 是用于 CUDA 应用程序的交互式内核分析器。

2 MIN READ

2022年 1月 17日

CUDA 11.6 工具包发布新版本

NVIDIA 发布了 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。

1 MIN READ

2022年 1月 13日

使用 NVIDIA CUDA-Pointpillars 检测点云中的对象

点云是坐标系中的点数据集。点包含丰富的信息，包括三维坐标（X、Y、Z）、颜色、分类值、强度值和时间等。

2 MIN READ

2022年 1月 12日

用标准语言并行性开发加速代码

NVIDIA 平台是最成熟、最完整的加速计算平台。在这篇文章中，我将介绍最简单、最高效、最可移植的加速计算方法。有三种编程方法 GPU （图…

3 MIN READ

2022年 1月 5日

通过 NVIDIA DLI 的入门课程开始学习 NVIDIA Triton

很多人喜欢构建机器学习模型。挑战包括确定要预测的变量、寻找最佳模型体系结构的实验，以及对正确的训练数据进行采样。但是，如果您无法访问该模型，

1 MIN READ

2021年 12月 17日

利用高性能虚拟工作站加速地球科学工作流程

无论是远程工作还是办公室工作，地球科学家都依赖于快速访问大型复杂数据集来提高工作效率。然而，他们高达 40% 的时间花在等待数据加载上，

1 MIN READ

2021年 12月 13日

使用 HPC SDK 21.11 （现已提供）最大限度地提高 HPC 应用程序的性能

在超级计算大会 (SC21) 上，NVIDIA 预先宣布了 HPC SDK 的下一次更新。今天，HPC SDK 21.11…

1 MIN READ

2021年 11月 29日

使用 cuTENSOR v1.4 编程分布式多 GPU 张量运算

今天， NVIDIA 宣布推出 cuTENSOR 1.4 版，它支持多达 64 维张量、分布式多 GPU 张量操作，

1 MIN READ

2021年 11月 23日

使用 CUTLASS v2.8 实现高性能矩阵乘法

NVIDIA 继续增强 Cutslass ，以提供对混合精度计算的广泛支持，提供专门的数据移动和多重累积抽象。今天，

1 MIN READ

2021年 11月 17日

MLPerf HPC v1.0 ：深入研究优化，创造 NVIDIA 创纪录的性能

在 MLPerf HPC v1 . 0 中， NVIDIA 供电系统赢得了五项新的行业指标中的四项，

2 MIN READ

2021年 11月 17日

以百万倍的性能克服高级计算难题

上周在 NVIDIA GTC 上，Jensen Huang 在计算性能方面展示了 the vision for realizing…

2 MIN READ