H100

2025年 3月 3日
AI 模型为环保人士提供大规模保护渔业和野生动物的新工具
为了遏制非法捕捞,研究人员发布了一个新的开源 AI 模型,该模型可以准确识别世界上几乎所有的航海船只的行为,包括船只是否可能非法捕捞。
1 MIN READ

2025年 2月 25日
NVIDIA cuDSS 提高工程和科学计算中的求解器技术
NVIDIA cuDSS 是第一代稀疏直接求解器库,旨在加速工程和科学计算。cuDSS 正越来越多地应用于数据中心和其他环境,
4 MIN READ

2025年 2月 14日
使用 NVIDIA TensorRT-LLM 前瞻性解码优化 Qwen2.5-Coder 吞吐量
专注于编码的 大语言模型(LLMs) 已稳步应用于开发者工作流程。从配对编程到自我改进的 AI 智能体 ,这些模型可帮助开发者完成各种任务,
3 MIN READ

2025年 2月 4日
新的 AI 模型提供癌症细胞级视图
研究癌症的研究人员推出了一种新的 AI 模型,该模型提供了癌细胞的细胞级映射和可视化,
1 MIN READ

2025年 1月 29日
借助 AI 驱动的细胞分析技术推进罕见疾病检测
由于传统基因组测序的局限性,罕见疾病很难诊断。哥伦比亚大学助理教授 Wolfgang Pernice 正在使用 AI…
1 MIN READ

2025年 1月 24日
动态内存压缩技术
尽管大语言模型(LLMs)作为通用 AI 工具取得了成功,但其对计算资源的高需求使其在许多真实场景中的部署具有挑战性。
3 MIN READ

2024年 12月 19日
AI 视觉技术助力绿色回收工厂智能化
全球每年仅回收约 13% 的 20 多亿吨城市垃圾。到 2050 年,全球每年的城市废弃物量将达到 3.88 亿吨。
1 MIN READ

2024年 12月 5日
聚焦:Perplexity AI 利用 NVIDIA 推理栈每月服务 4 亿个搜索请求
对 AI 赋能服务的需求持续快速增长,这给 IT 和基础设施团队带来了越来越大的压力。这些团队的任务是配置必要的硬件和软件来满足这一需求,
2 MIN READ

2024年 11月 14日
NVIDIA DOCA 2.9 借助新性能和安全功能强化人工智能和云计算基础设施
NVIDIA DOCA 通过为开发者提供全面的软件框架来利用硬件加速来增强 NVIDIA 网络平台的功能,从而提高性能、安全性和效率。
2 MIN READ

2024年 11月 14日
探索采用自主 AI 和 NVIDIA 机密计算的超级协议案例
机密和自主的 AI 是一种新的 AI 开发、训练和推理方法,其中用户的数据是去中心化的、私有的,并由用户自己控制。
3 MIN READ

2024年 11月 8日
NVIDIA TensorRT-LLM KV 缓存早期重用实现首个令牌速度 5 倍提升
在上一篇 博客文章 中,我们展示了通过将键值 (KV) 缓存卸载到 CPU 内存来重复使用该缓存如何在基于 x86 的 NVIDIA…
2 MIN READ

2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初发布于 2024 年 8 月 21 日,但已根据当前数据进行了修订。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ

2024年 10月 2日
AI 借助零采样学习发现罕见疾病的现有治疗药物
突破性的药物再利用 AI 模型可以为医生和患者带来新的希望,让他们尝试在现有治疗方案有限或根本没有的情况下治疗疾病。
1 MIN READ

2024年 9月 25日
Llama 3.2 加速部署从边缘到云端实现提速
扩展开源 Meta Llama 模型集合,Llama 3.2 集合包括视觉语言模型(VLM)、小语言模型(SLM)和更新版的 Llama…
2 MIN READ

2024年 8月 28日
NVIDIA Blackwell 平台在 MLPerf Inference v4.1 中创下新的 LLM 推理记录
大型语言模型 (LLM) 推理是一项全栈挑战。实现高吞吐量、低延迟推理需要强大的 GPU、高带宽 GPU 之间的互连、
4 MIN READ

2024年 8月 22日
Jamba 1.5 LLM 混合架构实现出色的推理和长上下文处理能力
AI21 Labs 推出了最新、最先进的 Jamba 1.5 模型系列,这是一个先进的大型语言模型(LLM)集合,
1 MIN READ