金融服务

2024年 5月 14日

NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持

NVIDIA 今天宣布最新发布的 NVIDIA TensorRT，一个用于高性能深度学习推理的 API 生态系统。

2 MIN READ

2024年 5月 14日

Databricks 上的 RAPIDS: GPU 加速数据处理指南

在当今数据驱动的环境中，最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…

3 MIN READ

2024年 5月 9日

革命性的图形分析： NVIDIA cuGraph 加速的下一代架构

在我们的先前的图分析探索中，我们使用 NVIDIA cuGraph 揭示了 GPU-CPU 融合的变革力量。基于这些见解，

3 MIN READ

2024年 5月 8日

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能，现已公开

在快速发展的环境中，生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长，

3 MIN READ

2024年 4月 30日

利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能

本周，我们发布了模型功能 DBRX，这是由 Databricks 开发的最先进的大型语言模型（LLM）。

1 MIN READ

2024年 4月 22日

Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持

本周发布的模型包括两个新的 NVIDIA AI 基础模型：Mistral Large 和 Mixtral 8x22B。

1 MIN READ

2024年 4月 18日

借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度

NVIDIA NeMo 是一个端到端平台，用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型，最近发布了 Parakeet-TDT。

2 MIN READ

2024年 4月 2日

使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

大型语言模型 (LLM) 可以从大量文本中学习，并为各种任务和领域生成流畅、一致的文本，从而彻底改变自然语言处理 (NLP)。然而，

7 MIN READ

2024年 3月 27日

借助 NVIDIA NeMo 开发自定义企业生成式 AI

生成式 AI 在计算领域发生了翻身，为人类以自然、直观的方式与计算机交互打开了新方式。对于企业来说，生成式 AI 的潜力巨大。

3 MIN READ

2024年 3月 21日

重新思考如何训练 Diffusion 模型

在探索了扩散模型采样、参数化和训练的基础知识之后，我们的团队开始研究这些网络架构的内部结构。请参考生成式 AI 研究聚焦：

2 MIN READ

2024年 3月 19日

NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录

NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…

2 MIN READ

2024年 3月 14日

在 LLM 架构中应用多专家模型

多专家模型 (MoE) 大型语言模型 (LLM) 架构最近出现了，无论是在 GPT-4 等专有 LLM 中，还是在开源版本的社区模型中，

3 MIN READ

2024年 3月 11日

借助 OpenUSD、MaterialX 和 OpenPBR，为虚拟世界解锁无缝材质交换

今天，NVIDIA 和 OpenUSD 联盟 (AOUSD) 宣布成立 AOUSD 材质工作组，

2 MIN READ

2024年 2月 27日

释放 Phi-2 小语言模型在聊天、研究、编码等领域的强大功能

本周发布的模型采用了 NVIDIA 优化后的语言模型 Phi-2，该模型适用于各种自然语言处理 (NLP) 任务。

1 MIN READ

2024年 2月 27日

视频：五分钟内构建 RAG 驱动的聊天机器人

检索增强生成（RAG）作为一种提升性能的技术，其受欢迎程度呈爆炸式增长。从高度准确的问答 AI 聊天机器人到代码生成副驾驶，

1 MIN READ

2024年 2月 20日

构建 LLM 支持的数据代理以进行数据分析

AI 智能体是一个由规划功能、内存和工具组成的系统，用于执行用户请求的任务。对于数据分析或与复杂系统交互等复杂任务，

4 MIN READ