LLM
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 13日
区域 LLM SEA-LION 和 SeaLLM 服务于东南亚的语言和文化
在最近于迪拜举行的世界各国政府首脑会议上,NVIDIA 首席执行官黄仁勋强调了 主权人工智能 的重要性,
1 MIN READ
2024年 5月 12日
用于高性能计算中代码开发的高级人工智能和检索增强生成
在快速发展的软件开发领域,聊天机器人和 GitHub Copilot 极大地改变了开发人员编写和管理代码的方式。
2 MIN READ
2024年 5月 8日
Amdocs 使用 NVIDIA NIM 加速世代 AI 性能并降低成本
电信公司(telcos)正在利用生成人工智能,通过自动化流程、改善客户体验和优化网络运营来提高员工生产力。
3 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 4月 23日
借助 Union.ai 和 NVIDIA DGX 云实现 AI 工作流程的大众化
GPU 最初专用于在电子游戏中渲染 3D 图形,主要用于加速线性代数计算。如今,GPU 已成为 AI 革命的关键组成部分之一。 现在,
2 MIN READ
2024年 4月 22日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能
我们很高兴地宣布支持 Meta Llama 3 系列模型,通过 NVIDIA TensorRT LLM 加速和优化 LLM 推理性能。
2 MIN READ
2024年 4月 22日
Mistral Large 和 Mixtral 8x22B LLM 现已由 NVIDIA NIM 和 NVIDIA API 提供支持
本周发布的模型包括两个新的 NVIDIA AI 基础模型:Mistral Large 和 Mixtral 8x22B。
1 MIN READ
2024年 4月 22日
借助 NVIDIA AI 基础模型 VISTA-2D 推进细胞分割和形态分析
基因组学研究人员使用不同的测序技术来更好地理解生物系统,包括单细胞和空间组学。与从细胞层面查看数据的单细胞不同,空间组学考虑了数据的位置,
2 MIN READ
2024年 4月 2日
使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM
大型语言模型 (LLM) 可以从大量文本中学习,并为各种任务和领域生成流畅、一致的文本,从而彻底改变自然语言处理 (NLP)。然而,
7 MIN READ
2024年 3月 27日
NVIDIA H200 Tensor Core GPU 和 NVIDIA TensorRT-LLM 集 MLPerf LLM 推理记录
随着生成式 AI 模型的持续创新,生成式 AI 在计算应用方面取得了巨大进步,从而大幅增强人类能力。这些模型包括 生成式 AI 模型,
3 MIN READ
2024年 3月 27日
借助 NVIDIA NeMo 开发自定义企业生成式 AI
生成式 AI 在计算领域发生了翻身,为人类以自然、直观的方式与计算机交互打开了新方式。对于企业来说,生成式 AI 的潜力巨大。
3 MIN READ
2024年 3月 20日
多模态检索增强生成的简单介绍
检索增强生成 (RAG) 应用程序如果能够处理各种数据类型,包括表格、图形和图表,而不仅仅是文本,其效用将会呈指数级增长。
2 MIN READ
2024年 3月 19日
FP8:前沿精度与性能的新篇章
在深度学习和人工智能的快速发展背景下,尤其是大语言模型(Large Language Model, LLM)的蓬勃发展,
3 MIN READ
2024年 3月 18日
如何通过四个步骤将 RAG 应用程序从试点阶段转变为生产阶段
生成式 AI 具有改变各个行业的巨大潜力。人类工作者已经开始使用 大型语言模型(LLM) 来解释、推理和解决复杂的认知任务。
2 MIN READ
2024年 3月 18日
借助加速以太网网络和网络存储扩展企业 RAG
在生成式人工智能中,机器不仅可以从数据中学习,还可以生成类似人类的文本、图像、视频等。检索增强生成 (RAG) 是一种突破性的方法。
2 MIN READ