硬件/半导体

2025年 7月 7日
提出一个维基百科规模的问题:如何利用数百万 token 的实时推理使世界更加智能
现代 AI 应用越来越依赖于将庞大的参数数量与数百万个令牌的上下文窗口相结合的模型。无论是经过数月对话的 AI 智能体、
3 MIN READ

2025年 6月 18日
抢先体验 NVIDIA GB200 系统如何帮助 LMarena 构建评估 LLM 的模型
在 NVIDIA 和 Nebius 的帮助下,加州大学伯克利分校的 LMArena 可以更轻松地了解哪些大语言模型在特定任务中表现出色。
2 MIN READ

2025年 6月 2日
使用外部文件上传在 NVIDIA Air 中构建可扩展且自定义网络拓扑的优势
NVIDIA Air 具有仿真从小型网络到整个数据中心的任何网络的独特能力。在开始配置、路由或管理之前,请先考虑拓扑。
1 MIN READ

2025年 5月 18日
借助 NVIDIA NVLink Fusion 将半定制计算平台集成到机架级架构
为了高效应对 AI 工作负载,数据中心正在被重构。这是一项非常复杂的工作,因此,
2 MIN READ

2025年 5月 13日
使用 NVIDIA Air 服务将仿真与现实世界连接
NVIDIA Air 通过创建与真实数据中心基础设施部署相同的副本来实现云规模效率。借助 NVIDIA Air,
1 MIN READ

2025年 5月 6日
NVIDIA NV-Tesseract 新一代时间序列模型助力数据集处理和异常检测的突破性进展
时间序列数据已从简单的历史记录演变为跨行业关键决策的实时引擎。无论是简化物流、预测市场,还是预测机器故障,
1 MIN READ

2025年 4月 23日
NVIDIA Secure AI 正式发布
随着许多企业开始对其数据进行 AI 训练或推理,需要保护数据和代码,尤其是大语言模型 (LLMs) 。由于数据敏感性,
1 MIN READ

2025年 4月 11日
AI Fabric 的弹性以及网络融合的重要性
高性能计算和深度学习工作负载对延迟极为敏感。数据包丢失会导致通信管道中的重传或停顿,从而直接增加延迟并中断 GPU 之间的同步。
1 MIN READ

2025年 4月 2日
NVIDIA Blackwell 在 MLPerf Inference v5.0 中实现巨大的性能飞跃
在不断增长的模型大小、实时延迟要求以及最近的 AI 推理的推动下, 大语言模型 (LLM) 推理的计算需求正在快速增长。与此同时,
3 MIN READ

2025年 3月 19日
AI 推理时代的 NVIDIA Blackwell Ultra
多年来,AI 的进步一直通过预训练扩展遵循清晰的轨迹:更大的模型、更多的数据和更丰富的计算资源带来了突破性的功能。在过去 5 年中,
2 MIN READ

2025年 2月 6日
适用于数据科学的 GPU 加速入门
在数据科学领域,运营效率是处理日益复杂和大型数据集的关键。GPU 加速已成为现代工作流程的关键,可显著提高性能。
3 MIN READ

2025年 2月 4日
NVIDIA Spectrum-X 网络平台和合作伙伴提升 AI 存储性能达48%
AI 工厂依靠的不仅仅是计算网。当然,连接 GPU 的东西向网络对于 AI 应用的性能至关重要,而连接高速存储阵列的存储网也不容忽视。
1 MIN READ

2025年 1月 30日
为 NVIDIA Blackwell GeForce RTX 50 系列 GPU 发布全新 AI SDK 和工具
NVIDIA 最近宣布推出 新一代 PC GPU – GeForce RTX 50 系列 ,以及面向开发者的全新 AI 赋能 SDK 和工具。
2 MIN READ

2024年 12月 12日
NVIDIA Air 简要介绍
AI 的出现带来了一种新型数据中心,即 AI 工厂 ,专门用于处理 AI 工作负载。AI 工作负载的范围和规模可能会有很大差异,
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 机密计算的超级协议案例
机密和自主的 AI 是一种新的 AI 开发、训练和推理方法,其中用户的数据是去中心化的、私有的,并由用户自己控制。
3 MIN READ

2024年 10月 29日
在 SONiC 中通过安全启动保护您的网络
NVIDIA 技术可帮助组织构建和维护安全、可扩展和高性能的网络基础设施。
1 MIN READ