生成式人工智能/大语言模型
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 13日
区域 LLM SEA-LION 和 SeaLLM 服务于东南亚的语言和文化
在最近于迪拜举行的世界各国政府首脑会议上,NVIDIA 首席执行官黄仁勋强调了 主权人工智能 的重要性,
1 MIN READ
2024年 5月 13日
使用 NVIDIA NeMo 定制神经机器翻译模型,第 1 部分
神经机器翻译(NMT)是一种将一序列的文字从一种语言翻译成另一种语言的自动任务。近年来,
2 MIN READ
2024年 5月 13日
使用 NVIDIA NeMo 定制神经机器翻译模型,第 2 部分
在 上一篇文章 中,我们介绍了使用 NeMo 运行英-中翻译模型的示例,并评估其性能。在这篇文章中,我们将指导您如何定制数据集,
3 MIN READ
2024年 5月 12日
利用人工智能实现量子计算
在实践中构建一台有用的量子计算机极具挑战性。需要在量子计算机的规模、保真度、速度、可靠性和可编程性方面进行重大改进,以充分实现其优势。
1 MIN READ
2024年 5月 12日
用于高性能计算中代码开发的高级人工智能和检索增强生成
在快速发展的软件开发领域,聊天机器人和 GitHub Copilot 极大地改变了开发人员编写和管理代码的方式。
2 MIN READ
2024年 5月 10日
具有条件节点的 CUDA 图的动态控制流
CUDA 图 可以显著提高性能,因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中,图形可以提供难以置信的好处,
2 MIN READ
2024年 5月 8日
使用 NVIDIA AI LangChain AI 端点构建 RAG 管道的提示
检索增强生成(RAG)是一种将信息检索与一组精心设计的系统提示相结合的技术,旨在从 大型语言模型(LLM)中生成高质量的内容。
3 MIN READ
2024年 5月 8日
Amdocs 使用 NVIDIA NIM 加速世代 AI 性能并降低成本
电信公司(telcos)正在利用生成人工智能,通过自动化流程、改善客户体验和优化网络运营来提高员工生产力。
3 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 5月 3日
基于 VILA 的 NVIDIA 硬件可视化语言模型
视觉语言模型最近有了显著的发展。然而,现有技术通常仅支持一个图像。他们无法在多个图像之间进行推理、支持上下文学习或理解视频。此外,
3 MIN READ
2024年 5月 3日
视觉语言智能与 Edge AI 2.0
VILA 是 NVIDIA Research 和麻省理工学院共同开发的一系列高性能视觉语言模型。这些模型的参数规模从 ~3B 到 ~40B…
3 MIN READ
2024年 5月 1日
聚光灯:Continental 和 SoftServe 通过 OpenUSD 提供世代人工智能驱动的虚拟工厂解决方案
随着汽车消费者越来越多地寻求更无缝、互联的驾驶体验,该行业越来越关注连接、先进的摄像系统和车内体验。 Continental,
1 MIN READ
2024年 4月 30日
利用基于专家的混合 DBRX 在不同任务上实现卓越的 LLM 性能
本周,我们发布了模型功能 DBRX,这是由 Databricks 开发的最先进的大型语言模型(LLM)。
1 MIN READ
2024年 4月 26日
使用 DRaFT+增强文本到图像的微调,现已是 NVIDIA NeMo 的一部分
文本到图像的 Diffusion 模型已经被建立为基于给定文本的高保真图像生成的强大方法。然而,
3 MIN READ
2024年 4月 26日
用于 SQL 和代码生成的新 LLM:Snowflake Arctic 模型
近年来,大型语言模型(LLM)彻底改变了自然语言处理(NLP),实现了文本摘要、问答和自然语言生成等广泛的应用。
1 MIN READ