Consumer Internet
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 6月 10日
聚焦:思科借助 NVIDIA BlueField-3 DPU 提高工作负载安全性和运营效率
随着网络攻击变得越来越复杂,组织必须不断采用先进的解决方案来保护其关键资产。其中一种解决方案是Cisco Secure Workload,
2 MIN READ
2024年 6月 5日
在 NVIDIA Holoscan SDK 中 构建集成 OpenCV 的零拷贝 AI 传感器处理流程
NVIDIA Holoscan 是 NVIDIA 的多模态实时 AI 传感器处理平台,旨在帮助开发者构建端到端传感器处理流程。
2 MIN READ
2024年 6月 4日
借助 NVIDIA JetPack 6.0 助力边缘云原生微服务,现已正式发布
NVIDIA JetPack SDK 为 NVIDIA Jetson 模组提供支持,为构建端到端加速的人工智能应用提供全面的解决方案。
3 MIN READ
2024年 5月 29日
生成式 AI 智能体开发者竞赛:入门技巧
参加我们将于 6 月 17 日结束的比赛,使用前沿技术展示您的创新成果:由生成式 AI 驱动的应用程序,
1 MIN READ
2024年 5月 21日
利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集
数据管护是预训练和持续训练模型的第一步,也可以说是最重要的一步,对于 大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。
3 MIN READ
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 14日
Databricks 上的 RAPIDS: GPU 加速数据处理指南
在当今数据驱动的环境中,最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…
3 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 4月 30日
利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能
本周,我们发布了模型功能 DBRX,这是由 Databricks 开发的最先进的大型语言模型(LLM)。
1 MIN READ
2024年 4月 22日
Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持
本周发布的模型包括两个新的 NVIDIA AI 基础模型:Mistral Large 和 Mixtral 8x22B。
1 MIN READ
2024年 4月 18日
借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度
NVIDIA NeMo 是一个端到端平台,用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型,最近发布了 Parakeet-TDT。
2 MIN READ
2024年 3月 27日
借助 NVIDIA NeMo Evaluator 简化 LLM 的准确性评估
大型语言模型 (LLM) 从处理复杂的编码任务到创作引人入胜的故事,再到翻译自然语言,已展示出非凡的功能。企业正在定制这些模型,
1 MIN READ
2024年 3月 21日
重新思考如何训练 Diffusion 模型
在探索了扩散模型采样、参数化和训练的基础知识之后,我们的团队开始研究这些网络架构的内部结构。请参考 生成式 AI 研究聚焦:
2 MIN READ
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
2024年 3月 14日
在 LLM 架构中应用多专家模型
多专家模型 (MoE) 大型语言模型 (LLM) 架构最近出现了,无论是在 GPT-4 等专有 LLM 中,还是在开源版本的社区模型中,
3 MIN READ