Consumer Internet
2025年 1月 9日
宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集
NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 ,
1 MIN READ
2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ
2024年 11月 20日
使用 EMBark 加速大规模推荐系统嵌入式训练优化
推荐系统是互联网行业的核心,而高效地训练这些系统对于各大公司来说是一个关键问题。大多数推荐系统是深度学习推荐模型(DLRMs),
2 MIN READ
2024年 10月 28日
NVIDIA 中构建 RAG 基问答大语言模型工作流程
利用检索增强生成(RAG)技术快速开发解决方案,助力问答 LLM 工作流程,由此催生出新型系统架构。NVIDIA 将 AI 用于内部运营,
3 MIN READ
2024年 8月 7日
利用 NVIDIA NIM 微服务和 LangChain 构建智能代理系统
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,现在支持对 Llama 3.1 等模型进行工具调用。
1 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 6月 10日
聚焦:思科借助 NVIDIA BlueField-3 DPU 提高工作负载安全性和运营效率
随着网络攻击变得越来越复杂,组织必须不断采用先进的解决方案来保护其关键资产。其中一种解决方案是Cisco Secure Workload,
2 MIN READ
2024年 6月 7日
借助 NVIDIA NIM 无缝部署大量 LoRA Adapters
最新的先进基础大型语言模型 (LLM) 拥有数十亿个参数,并已在数万亿个输入文本标记上进行了预训练。它们通常在各种用例上都取得了惊人的成果,
2 MIN READ
2024年 6月 5日
在 NVIDIA Holoscan SDK 中 构建集成 OpenCV 的零拷贝 AI 传感器处理流程
NVIDIA Holoscan 是 NVIDIA 的多模态实时 AI 传感器处理平台,旨在帮助开发者构建端到端传感器处理流程。
2 MIN READ
2024年 6月 4日
借助 NVIDIA JetPack 6.0 助力边缘云原生微服务,现已正式发布
NVIDIA JetPack SDK 为 NVIDIA Jetson 模组提供支持,为构建端到端加速的人工智能应用提供全面的解决方案。
3 MIN READ
2024年 5月 29日
生成式 AI 智能体开发者竞赛:入门技巧
参加我们将于 6 月 17 日结束的比赛,使用前沿技术展示您的创新成果:由生成式 AI 驱动的应用程序,
1 MIN READ
2024年 5月 21日
利用 NVIDIA NeMo Curator 为 LLM 训练整理自定义数据集
数据管护是预训练和持续训练模型的第一步,也可以说是最重要的一步,对于 大型语言模型 (LLM) 和小型语言模型 (SLM) 都至关重要。
3 MIN READ
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 14日
Databricks 上的 RAPIDS: GPU 加速数据处理指南
在当今数据驱动的环境中,最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…
3 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 4月 30日
利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能
本周,我们发布了模型功能 DBRX,这是由 Databricks 开发的最先进的大型语言模型(LLM)。
1 MIN READ