金融服务
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 14日
Databricks 上的 RAPIDS: GPU 加速数据处理指南
在当今数据驱动的环境中,最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…
3 MIN READ
2024年 5月 9日
革命性的图形分析: NVIDIA cuGraph 加速的下一代架构
在我们的 先前的图分析探索 中,我们使用 NVIDIA cuGraph 揭示了 GPU-CPU 融合的变革力量。基于这些见解,
3 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 4月 30日
利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能
本周,我们发布了模型功能 DBRX,这是由 Databricks 开发的最先进的大型语言模型(LLM)。
1 MIN READ
2024年 4月 22日
Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持
本周发布的模型包括两个新的 NVIDIA AI 基础模型:Mistral Large 和 Mixtral 8x22B。
1 MIN READ
2024年 4月 18日
借助 NVIDIA NeMo Parakeet-TDT 提高 ASR 的准确性和速度
NVIDIA NeMo 是一个端到端平台,用于在任何云和本地的任何地方大规模开发多模式生成 AI 模型,最近发布了 Parakeet-TDT。
2 MIN READ
2024年 4月 2日
使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM
大型语言模型 (LLM) 可以从大量文本中学习,并为各种任务和领域生成流畅、一致的文本,从而彻底改变自然语言处理 (NLP)。然而,
7 MIN READ
2024年 3月 27日
借助 NVIDIA NeMo 开发自定义企业生成式 AI
生成式 AI 在计算领域发生了翻身,为人类以自然、直观的方式与计算机交互打开了新方式。对于企业来说,生成式 AI 的潜力巨大。
3 MIN READ
2024年 3月 21日
重新思考如何训练 Diffusion 模型
在探索了扩散模型采样、参数化和训练的基础知识之后,我们的团队开始研究这些网络架构的内部结构。请参考 生成式 AI 研究聚焦:
2 MIN READ
2024年 3月 19日
NVIDIA 语音和翻译 AI 模型在速度和准确性方面创下记录
NVIDIA 开发的语音和翻译 AI 模型正在推动性能和创新的发展。NVIDIA Parakeet 自动语音识别 (ASR) 模型系列以及…
2 MIN READ
2024年 3月 14日
在 LLM 架构中应用多专家模型
多专家模型 (MoE) 大型语言模型 (LLM) 架构最近出现了,无论是在 GPT-4 等专有 LLM 中,还是在开源版本的社区模型中,
3 MIN READ
2024年 3月 11日
借助 OpenUSD、MaterialX 和 OpenPBR,为虚拟世界解锁无缝材质交换
今天,NVIDIA 和 OpenUSD 联盟 (AOUSD) 宣布成立 AOUSD 材质工作组,
2 MIN READ
2024年 2月 27日
释放 Phi-2 小语言模型在聊天、研究、编码等领域的强大功能
本周发布的模型采用了 NVIDIA 优化后的语言模型 Phi-2,该模型适用于各种自然语言处理 (NLP) 任务。
1 MIN READ
2024年 2月 27日
视频:五分钟内构建 RAG 驱动的聊天机器人
检索增强生成(RAG)作为一种提升性能的技术,其受欢迎程度呈爆炸式增长。从高度准确的问答 AI 聊天机器人到代码生成副驾驶,
1 MIN READ
2024年 2月 20日
构建 LLM 支持的数据代理以进行数据分析
AI 智能体是一个由规划功能、内存和工具组成的系统,用于执行用户请求的任务。对于数据分析或与复杂系统交互等复杂任务,
4 MIN READ