高性能计算
2024年 4月 19日
利用 NVIDIA Merlin HierarchicalKV 实现唯品会在搜推广场景中的 GPU 推理实践
本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin…
2 MIN READ
2022年 8月 23日
NVIDIA Grace CPU 内部:NVIDIA 为 HPC 和 AI 加强超级芯片工程
NVIDIA Grace CPU 是 NVIDIA 开发的第一个数据中心 CPU 。它是从头开始建造的,以创建 世界上第一个超级芯片 .
4 MIN READ
2022年 5月 19日
腾讯广告视频抽帧的全流程 GPU 加速
腾讯广告的开发人员改进了视频抽帧的实现方式,使得全流程的操作均在 GPU 上完成,取代了原有的 CPU 抽帧流程,提高了性能,并降低了成本。
4 MIN READ
2022年 5月 19日
NVIDIA A100 加速医学图像处理深度学习研究
本案例中通过 NVIDIA A100 GPU 加速器,上海市磁共振重点实验室构建了高效的深度学习科研硬件平台,
1 MIN READ
2022年 1月 27日
多节点多 GPU :大规模使用 NVIDIA cuFFTMp FFT
今天,NVIDIA 宣布发布 Early Access ( EA )的 cuFFTMp 。 cuFFTMp 是 cuFFT 的多节点、
4 MIN READ
2022年 1月 27日
使用最新的 Nsight Compute 进行高级内核评测
NVIDIA Nsight Compute 是用于 CUDA 应用程序的交互式内核分析器。
2 MIN READ
2022年 1月 17日
CUDA 11.6 工具包发布新版本
NVIDIA 发布了 CUDA 开发环境 CUDA 11.6 的最新版本。本版本的重点是增强 CUDA 应用程序的编程模型和性能。
1 MIN READ
2022年 1月 13日
使用 NVIDIA CUDA-Pointpillars 检测点云中的对象
点云是坐标系中的点数据集。点包含丰富的信息,包括三维坐标(X、Y、Z)、颜色、分类值、强度值和时间等。
2 MIN READ
2022年 1月 12日
用标准语言并行性开发加速代码
NVIDIA 平台是最成熟、最完整的加速计算平台。在这篇文章中,我将介绍最简单、最高效、最可移植的加速计算方法。有三种编程方法 GPU (图…
3 MIN READ
2022年 1月 5日
通过 NVIDIA DLI 的入门课程开始学习 NVIDIA Triton
很多人喜欢构建机器学习模型。挑战包括确定要预测的变量、寻找最佳模型体系结构的实验,以及对正确的训练数据进行采样。但是,如果您无法访问该模型,
1 MIN READ
2021年 12月 17日
利用高性能虚拟工作站加速地球科学工作流程
无论是远程工作还是办公室工作,地球科学家都依赖于快速访问大型复杂数据集来提高工作效率。然而,他们高达 40% 的时间花在等待数据加载上,
1 MIN READ
2021年 12月 13日
使用 HPC SDK 21.11 (现已提供)最大限度地提高 HPC 应用程序的性能
在超级计算大会 (SC21) 上,NVIDIA 预先宣布了 HPC SDK 的下一次更新。今天,HPC SDK 21.11…
1 MIN READ
2021年 11月 29日
使用 cuTENSOR v1.4 编程分布式多 GPU 张量运算
今天, NVIDIA 宣布推出 cuTENSOR 1.4 版,它支持多达 64 维张量、分布式多 GPU 张量操作,
1 MIN READ
2021年 11月 23日
使用 CUTLASS v2.8 实现高性能矩阵乘法
NVIDIA 继续增强 Cutslass ,以提供对混合精度计算的广泛支持,提供专门的数据移动和多重累积抽象。今天,
1 MIN READ
2021年 11月 17日
MLPerf HPC v1.0 :深入研究优化,创造 NVIDIA 创纪录的性能
在 MLPerf HPC v1 . 0 中, NVIDIA 供电系统赢得了五项新的行业指标中的四项,
2 MIN READ
2021年 11月 17日
以百万倍的性能克服高级计算难题
上周在 NVIDIA GTC 上,Jensen Huang 在计算性能方面展示了 the vision for realizing…
2 MIN READ