Consumer Internet

2024年 6月 12日

在 cuBLAS 中引入分组 GEMM API 以及更多性能更新

最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习（DL）和高性能计算（HPC）工作负载提供功能和性能。

2 MIN READ

2024年 6月 10日

聚焦：思科借助 NVIDIA BlueField-3 DPU 提高工作负载安全性和运营效率

随着网络攻击变得越来越复杂，组织必须不断采用先进的解决方案来保护其关键资产。其中一种解决方案是Cisco Secure Workload，

2 MIN READ

2024年 6月 5日

在 NVIDIA Holoscan SDK 中构建集成 OpenCV 的零拷贝 AI 传感器处理流程

NVIDIA Holoscan 是 NVIDIA 的多模态实时 AI 传感器处理平台，旨在帮助开发者构建端到端传感器处理流程。

2 MIN READ

2024年 6月 4日

借助 NVIDIA JetPack 6.0 助力边缘云原生微服务，现已正式发布

NVIDIA JetPack SDK 为 NVIDIA Jetson 模组提供支持，为构建端到端加速的人工智能应用提供全面的解决方案。

3 MIN READ

2024年 5月 29日

生成式 AI 智能体开发者竞赛：入门技巧

参加我们将于 6 月 17 日结束的比赛，使用前沿技术展示您的创新成果：由生成式 AI 驱动的应用程序，

1 MIN READ

2024年 5月 21日

利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集

数据管护是预训练和持续训练模型的第一步，也可以说是最重要的一步，对于大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。

3 MIN READ

2024年 5月 14日

NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持

NVIDIA 今天宣布最新发布的 NVIDIA TensorRT，一个用于高性能深度学习推理的 API 生态系统。

2 MIN READ

2024年 5月 14日

Databricks 上的 RAPIDS: GPU 加速数据处理指南

在当今数据驱动的环境中，最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…

3 MIN READ

2024年 5月 8日

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能，现已公开

在快速发展的环境中，生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长，

3 MIN READ

2024年 4月 30日

利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能

本周，我们发布了模型功能 DBRX，这是由 Databricks 开发的最先进的大型语言模型（LLM）。

1 MIN READ

2024年 4月 22日

Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持

本周发布的模型包括两个新的 NVIDIA AI 基础模型：Mistral Large 和 Mixtral 8x22B。

1 MIN READ

2024年 4月 18日

借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度

NVIDIA NeMo 是一个端到端平台，用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型，最近发布了 Parakeet-TDT。

2 MIN READ

2024年 3月 27日

借助 NVIDIA NeMo Evaluator 简化 LLM 的准确性评估

大型语言模型 (LLM) 从处理复杂的编码任务到创作引人入胜的故事，再到翻译自然语言，已展示出非凡的功能。企业正在定制这些模型，

1 MIN READ

2024年 3月 21日

重新思考如何训练 Diffusion 模型

在探索了扩散模型采样、参数化和训练的基础知识之后，我们的团队开始研究这些网络架构的内部结构。请参考生成式 AI 研究聚焦：

2 MIN READ

2024年 3月 19日

NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录

NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…

2 MIN READ

2024年 3月 14日

在 LLM 架构中应用多专家模型

多专家模型 (MoE) 大型语言模型 (LLM) 架构最近出现了，无论是在 GPT-4 等专有 LLM 中，还是在开源版本的社区模型中，

3 MIN READ

Consumer Internet

在 cuBLAS 中引入分组 GEMM API 以及更多性能更新

聚焦：思科借助 NVIDIA BlueField-3 DPU 提高工作负载安全性和运营效率

在 NVIDIA Holoscan SDK 中 构建集成 OpenCV 的零拷贝 AI 传感器处理流程

借助 NVIDIA JetPack 6.0 助力边缘云原生微服务，现已正式发布

生成式 AI 智能体开发者竞赛：入门技巧

利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集

NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持

Databricks 上的 RAPIDS: GPU 加速数据处理指南

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能，现已公开

利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能

Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持

借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度

借助 NVIDIA NeMo Evaluator 简化 LLM 的准确性评估

重新思考如何训练 Diffusion 模型

NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录

在 LLM 架构中应用多专家模型

在 NVIDIA Holoscan SDK 中构建集成 OpenCV 的零拷贝 AI 传感器处理流程