TensorRT
2024年 7月 24日
借助最新 NVIDIA Merlin TensorFlow 插件实现大规模 Embedding 扩展
通过封装 NVIDIA Merlin HugeCTR,Sparse Operation Kit(以下简称 SOK)使得…
4 MIN READ
2024年 6月 11日
借助 NVIDIA TensorRT 轻量级引擎,为 AI 应用提供卓越性能和最小占用空间
NVIDIA TensorRT一个成熟的数据中心推理库,已迅速成为 NVIDIA GeForce RTX 和 NVIDIA RTX GPU…
2 MIN READ
2024年 6月 3日
NVIDIA 与 Hugging Face 合作,简化生成式 AI 模型部署
随着生成式 AI 的快速增长,社区通过两种重要方式加强了这种扩展:快速发布先进的基础模型,以及简化其与应用程序开发和生产的集成。
2 MIN READ
2024年 6月 2日
借助适用于 Windows RTX PC 的 NVIDIA RTX AI 工具包,简化 AI 驱动型应用的开发
NVIDIA 今日发布了 NVIDIA RTX AI 工具包,这是一个工具和 SDK 集合,
2 MIN READ
2024年 5月 30日
借助 Gipi、 NVIDIA TensortRT-LLM 和 AI 基础模型实现个性化学习
超过 1.2 亿人 正在积极学习新语言,而 5 亿学习者 正在数字学习平台(如 Duolingo)上学习。与此同时,全球很大一部分人口,
2 MIN READ
2024年 5月 14日
NVIDIA TensorRT 10.0 升级可用性、性能和 AI 模型支持
NVIDIA 今天宣布最新发布的 NVIDIA TensorRT,一个用于高性能深度学习推理的 API 生态系统。
2 MIN READ
2024年 5月 8日
NVIDIA TensorRT 模型优化器加速生成人工智能推理性能,现已公开
在快速发展的环境中,生成人工智能的发展对加速推理速度的需求仍然是一个紧迫的问题。随着模型规模和复杂性的指数级增长,
3 MIN READ
2024年 4月 2日
使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM
大型语言模型 (LLM) 可以从大量文本中学习,并为各种任务和领域生成流畅、一致的文本,从而彻底改变自然语言处理 (NLP)。然而,
7 MIN READ
2024年 3月 19日
FP8:前沿精度与性能的新篇章
在深度学习和人工智能的快速发展背景下,尤其是大语言模型(Large Language Model, LLM)的蓬勃发展,
3 MIN READ
2024年 3月 18日
借助 NVIDIA NeMo Retriever,将企业数据转换为可行见解
在每个行业和每个工作职能部门,生成式 AI 正在激发组织内部的潜力,它将数据转化为知识,并使员工能够更高效地工作。
2 MIN READ
2024年 3月 7日
在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像
扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术,将随机噪声逐步塑造为 AI 生成的艺术,
4 MIN READ
2024年 3月 7日
NVIDIA TensorRT 通过 8 位预训练量化将 Stable Diffusion 的速度提升近 2 倍
在生成式 AI 的动态领域,扩散模型脱颖而出,成为使用文本提示生成高质量图像的功能强大的架构 .
3 MIN READ
2024年 2月 1日
借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 部署 AI 编码助手
大型语言模型 (LLM) 的出现革新了人工智能领域,为与数字世界的交互提供了全新的方式。尽管 LLM 通常能够提供良好的通用解决方案,
4 MIN READ
2024年 1月 29日
使用全卷积网络在 Transformer 模型中模拟注意力机制
在过去十年中,深度学习技术在计算机视觉 (CV) 任务中的应用大幅增加。卷积神经网络 (CNN) 一直是这场革命的基石,展示了卓越的性能,
3 MIN READ
2024年 1月 16日
强大的场景文本检测和识别:简介
识别和识别自然场景和图像中的文本对于视频标题文本识别、检测车载摄像头的标牌、信息检索、场景理解、车牌识别以及识别产品文本等用例变得非常重要。
1 MIN READ
2024年 1月 16日
强大的场景文本检测和识别:实施
要使场景文本检测和识别适用于不规则文本或特定用例,您必须完全控制模型,以便根据用例和数据集执行增量学习或微调。请记住,此工作流是场景理解、
2 MIN READ