生成式人工智能/大语言模型

2024年 5月 14日

NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持

NVIDIA 今天宣布最新发布的 NVIDIA TensorRT，一个用于高性能深度学习推理的 API 生态系统。

2 MIN READ

2024年 5月 13日

区域 LLM SEA-LION 和 SeaLLM 服务于东南亚的语言和文化

在最近于迪拜举行的世界各国政府首脑会议上，NVIDIA 首席执行官黄仁勋强调了主权人工智能的重要性，

1 MIN READ

2024年 5月 13日

使用 NVIDIA NeMo 定制神经机器翻译模型，第 1 部分

神经机器翻译（NMT）是一种将一序列的文字从一种语言翻译成另一种语言的自动任务。近年来，

2 MIN READ

2024年 5月 13日

使用 NVIDIA NeMo 定制神经机器翻译模型，第 2 部分

在上一篇文章中，我们介绍了使用 NeMo 运行英-中翻译模型的示例，并评估其性能。在这篇文章中，我们将指导您如何定制数据集，

3 MIN READ

2024年 5月 12日

利用人工智能实现量子计算

在实践中构建一台有用的量子计算机极具挑战性。需要在量子计算机的规模、保真度、速度、可靠性和可编程性方面进行重大改进，以充分实现其优势。

1 MIN READ

2024年 5月 12日

用于高性能计算中代码开发的高级人工智能和检索增强生成

在快速发展的软件开发领域，聊天机器人和 GitHub Copilot 极大地改变了开发人员编写和管理代码的方式。

2 MIN READ

2024年 5月 10日

具有条件节点的 CUDA 图的动态控制流

CUDA 图可以显著提高性能，因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中，图形可以提供难以置信的好处，

2 MIN READ

2024年 5月 8日

使用 NVIDIA AI LangChain AI 端点构建 RAG 管道的提示

检索增强生成（RAG）是一种将信息检索与一组精心设计的系统提示相结合的技术，旨在从大型语言模型（LLM）中生成高质量的内容。

3 MIN READ

2024年 5月 8日

Amdocs 使用 NVIDIA NIM 加速世代 AI 性能并降低成本

电信公司（telcos）正在利用生成人工智能，通过自动化流程、改善客户体验和优化网络运营来提高员工生产力。

3 MIN READ

2024年 5月 8日

NVIDIA TensorRT 模型优化器加速生成人工智能推理性能，现已公开

在快速发展的环境中，生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长，

3 MIN READ

2024年 5月 3日

基于 VILA 的 NVIDIA 硬件可视化语言模型

视觉语言模型最近有了显著的发展。然而，现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外，

3 MIN READ

2024年 5月 3日

视觉语言智能与 Edge AI 2.0

VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…

3 MIN READ

2024年 5月 1日

聚光灯：Continental 和 SoftServe 通过 OpenUSD 提供世代人工智能驱动的虚拟工厂解决方案

随着汽车消费者越来越多地寻求更无缝、互联的驾驶体验，该行业越来越关注连接、先进的摄像系统和车内体验。 Continental，

1 MIN READ

2024年 4月 30日

利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能

本周，我们发布了模型功能 DBRX，这是由 Databricks 开发的最先进的大型语言模型（LLM）。

1 MIN READ

2024年 4月 26日

使用 DRaFT+增强文本到图像的微调，现已是 NVIDIA NeMo 的一部分

文本到图像的 Diffusion 模型已经被建立为基于给定文本的高保真图像生成的强大方法。然而，

3 MIN READ

2024年 4月 26日

用于 SQL 和代码生成的新 LLM:Snowflake Arctic 模型

近年来，大型语言模型（LLM）彻底改变了自然语言处理（NLP），实现了文本摘要、问答和自然语言生成等广泛的应用。

1 MIN READ