加速计算
2024年 1月 15日
使用 NVIDIA TensorRT-LLM 支持 CodeFuse-CodeLlama-34B 上的 int4 量化和推理优化实践
Codefuse(https://github.com/codefuse-ai)是由蚂蚁集团开发的代码语言大模型,
3 MIN READ
2023年 12月 4日
如何在 NVIDIA TensorRT-LLM 中支持 Qwen 模型
大型语言模型正以其惊人的新能力推动人工智能的发展,扩大其应用范围。然而,由于这类模型具有庞大的参数规模,部署和推理的难度和成本极高,
2 MIN READ
2022年 6月 30日
推荐系统峰会 2022
欢迎于 7 月 29 日加入由 NVIDIA 所主办的推荐系统峰会,与 NVIDIA、阿里巴巴、腾讯、美团等公司的专家在线交流,
1 MIN READ
2022年 6月 23日
Merlin HugeCTR Sparse Operation Kit 系列之二
摘要 在上期文章中,我们对 HugeCTR Sparse Operation Kit (以下简称SOK) 的基本功能,性能,
3 MIN READ
2022年 6月 23日
HugeCTR v3.6 & v3.7 发布说明
Merlin HugeCTR(以下简称 HugeCTR)是 GPU 加速的推荐程序框架,
1 MIN READ
2022年 3月 29日
Merlin HugeCTR 分级参数服务器系列之二
在上一期的 HugeCTR 分级参数服务器简介中,
2 MIN READ
2022年 3月 9日
Merlin HugeCTR v3.4.1 发布说明
Merlin HugeCTR(以下简称 HugeCTR)是 GPU 加速的推荐程序框架,
1 MIN READ
2021年 10月 6日
具有 RAPIDS cuML 的 GPU 加速分层 DBSCAN –让我们回到未来
不同领域的数据科学家使用聚类方法在他们的数据集中找到自然的“相似”观察组。流行的聚类方法可以是: 基于层次密度的应用程序空间聚类 w /
3 MIN READ
2021年 10月 6日
边缘人工智能的未来是本地云
推理因其灵活性而成为边缘计算的杀手级应用。今天,边缘推理(也称为边缘 AI)解决了各个行业的问题:防止盗窃、发现疾病和减少农田中除草剂的使用。
1 MIN READ
2021年 10月 5日
NVIDIA CloudXR 现已集成到 VMware Workspace ONE XR 集线器中
NVIDIA 和 VMware 通过发布 Workspace ONE XR Hub ,帮助企业将 XR 流媒体传输到云端,
1 MIN READ
2021年 10月 5日
VxRail 使用 vSAN RDMA 提高应用程序性能
混合云是指内部部署基础架构(如 Dell EMC VxRail hyperconverged infrastructure ( HCI…
1 MIN READ
2021年 8月 25日
NGC 上新增:最新版本的 NeMo 、 HPC SDK 、 DOCA 、 PyTorch Lightning 等
NVIDIA NGC 目录是 GPU 优化深度学习、机器学习和 HPC 应用程序的中心。借助高性能软件containers、预训练模型、
1 MIN READ
2021年 7月 30日
MLPerf v1.0 培训基准:对创纪录 NVIDIA 性能的洞察
MLPerf 是一个全行业人工智能联盟,其任务是开发一套性能基准,涵盖广泛使用的一系列主要人工智能工作负载。最新的 mlperfv1 .
8 MIN READ
2021年 7月 22日
NVIDIA 宣布推出带有新 HPC SDK v21.7 的 Arm HPC 开发人员套件
今天 NVIDIA 宣布了 NVIDIA Arm HPC 开发工具包 和 NVIDIA HPC 软件开发包 版本 21 . 7 的可用性。
1 MIN READ
2021年 7月 12日
通过 NVIDIA 硬件资助计划加速学术研究和课程设置
NVIDIA 硬件资助计划通过与世界各地的学术机构合作,帮助研究人员和教育工作者使用业界领先的硬件和软件,从而推动人工智能和数据科学的发展。
1 MIN READ
2021年 7月 2日
向 NVIDIA GPU Operator 添加 MIG、预装驱动程序等
在 Kubernetes 中使用 GPU 可靠地配置服务器可能很快变得复杂,因为必须安装和管理多个组件才能使用 GPU。
2 MIN READ