加速计算

2024年 1月 15日

使用 NVIDIA TensorRT-LLM 支持 CodeFuse-CodeLlama-34B 上的 int4 量化和推理优化实践

Codefuse（https://github.com/codefuse-ai）是由蚂蚁集团开发的代码语言大模型，

3 MIN READ

2023年 12月 4日

如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

大型语言模型正以其惊人的新能力推动人工智能的发展，扩大其应用范围。然而，由于这类模型具有庞大的参数规模，部署和推理的难度和成本极高，

2 MIN READ

2022年 6月 30日

Merlin HugeCTR Sparse Operation Kit 系列之二

摘要在上期文章中，我们对 HugeCTR Sparse Operation Kit (以下简称SOK) 的基本功能，性能，

3 MIN READ

2022年 6月 23日

HugeCTR v3.6 & v3.7 发布说明

Merlin HugeCTR（以下简称 HugeCTR）是 GPU 加速的推荐程序框架，

1 MIN READ

2022年 3月 29日

Merlin HugeCTR 分级参数服务器系列之二

在上一期的 HugeCTR 分级参数服务器简介中，

2 MIN READ

2022年 3月 9日

Merlin HugeCTR v3.4.1 发布说明

Merlin HugeCTR（以下简称 HugeCTR）是 GPU 加速的推荐程序框架，

1 MIN READ

2021年 10月 6日

具有 RAPIDS cuML 的 GPU 加速分层 DBSCAN –让我们回到未来

不同领域的数据科学家使用聚类方法在他们的数据集中找到自然的“相似”观察组。流行的聚类方法可以是：基于层次密度的应用程序空间聚类 w /

3 MIN READ

2021年 10月 6日

边缘人工智能的未来是本地云

推理因其灵活性而成为边缘计算的杀手级应用。今天，边缘推理（也称为边缘 AI）解决了各个行业的问题：防止盗窃、发现疾病和减少农田中除草剂的使用。

1 MIN READ

2021年 10月 5日

NVIDIA CloudXR 现已集成到 VMware Workspace ONE XR 集线器中

NVIDIA 和 VMware 通过发布 Workspace ONE XR Hub ，帮助企业将 XR 流媒体传输到云端，

1 MIN READ

2021年 10月 5日

VxRail 使用 vSAN RDMA 提高应用程序性能

混合云是指内部部署基础架构（如 Dell EMC VxRail hyperconverged infrastructure （ HCI…

1 MIN READ

2021年 8月 25日

NGC 上新增：最新版本的 NeMo 、 HPC SDK 、 DOCA 、 PyTorch Lightning 等

NVIDIA NGC 目录是 GPU 优化深度学习、机器学习和 HPC 应用程序的中心。借助高性能软件containers、预训练模型、

1 MIN READ

2021年 7月 30日

MLPerf v1.0 培训基准：对创纪录 NVIDIA 性能的洞察

MLPerf 是一个全行业人工智能联盟，其任务是开发一套性能基准，涵盖广泛使用的一系列主要人工智能工作负载。最新的 mlperfv1 .

8 MIN READ

2021年 7月 22日

NVIDIA 宣布推出带有新 HPC SDK v21.7 的 Arm HPC 开发人员套件

今天 NVIDIA 宣布了 NVIDIA Arm HPC 开发工具包和 NVIDIA HPC 软件开发包版本 21 . 7 的可用性。

1 MIN READ

2021年 7月 12日

通过 NVIDIA 硬件资助计划加速学术研究和课程设置

NVIDIA 硬件资助计划通过与世界各地的学术机构合作，帮助研究人员和教育工作者使用业界领先的硬件和软件，从而推动人工智能和数据科学的发展。

1 MIN READ

2021年 7月 2日

向 NVIDIA GPU Operator 添加 MIG、预装驱动程序等

在 Kubernetes 中使用 GPU 可靠地配置服务器可能很快变得复杂，因为必须安装和管理多个组件才能使用 GPU。

2 MIN READ

加速计算

使用 NVIDIA TensorRT-LLM 支持 CodeFuse-CodeLlama-34B 上的 int4 量化和推理优化实践

如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型

推荐系统峰会 2022

Merlin HugeCTR Sparse Operation Kit 系列之二

HugeCTR v3.6 & v3.7 发布说明

Merlin HugeCTR 分级参数服务器系列之二

Merlin HugeCTR v3.4.1 发布说明

具有 RAPIDS cuML 的 GPU 加速分层 DBSCAN –让我们回到未来

边缘人工智能的未来是本地云

NVIDIA CloudXR 现已集成到 VMware Workspace ONE XR 集线器中

VxRail 使用 vSAN RDMA 提高应用程序性能

NGC 上新增：最新版本的 NeMo 、 HPC SDK 、 DOCA 、 PyTorch Lightning 等

MLPerf v1.0 培训基准：对创纪录 NVIDIA 性能的洞察

NVIDIA 宣布推出带有新 HPC SDK v21.7 的 Arm HPC 开发人员套件

通过 NVIDIA 硬件资助计划加速学术研究和课程设置

向 NVIDIA GPU Operator 添加 MIG、预装驱动程序等