AI Inference

2024年 2月 1日

大型语言模型 (LLM) 的出现革新了人工智能领域，为与数字世界的交互提供了全新的方式。尽管 LLM 通常能够提供良好的通用解决方案，

4 MIN READ

2024年 1月 29日

在过去十年中，深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石，展示了卓越的性能，

3 MIN READ

2024年 1月 8日

大型语言模型 (LLM) 正在从根本上改变我们与计算机的交互方式。从互联网搜索到办公效率工具，这些模型正被整合到各种应用中。

2 MIN READ

2024年 1月 4日

数据科学家利用生成式 AI和预测分析构建新一代 AI 应用。在金融服务领域，AI 建模和推理可用于多种解决方案，包括用于投资分析的替代数据、

3 MIN READ

2023年 12月 14日

借助互联网级数据，AI 生成内容的计算需求显著增加，数据中心在数周或数月内全力运行单个模型，更不用说通常作为服务提供的高生成推理成本。

5 MIN READ

2023年 12月 13日

出色的 AI 性能需要高效的并行计算架构、高效的工具堆栈和深度优化的算法。NVIDIA 发布了 NVIDIA TensorRT-LLM，

2 MIN READ

2023年 11月 27日

NVIDIA 最近宣布了 NVIDIA NeMo SteerLM 技术，它是 NVIDIA NeMo 的一部分。

3 MIN READ

2023年 11月 17日

通过堆叠 Transformer 层来创建大型模型，可以提高准确性、实现少量学习功能，并且在各种语言任务中实现近乎人类的性能。

4 MIN READ