Triton Inference Server

2024年 6月 14日

通过五门新的 NVIDIA 技术课程提升您的技能

随着人工智能以前所未有的速度引入技术创新，保持领先意味着保持你的技能与时俱进。NVIDIA 开发者计划为您提供所需的工具、培训和资源，

1 MIN READ

2024年 5月 17日

借助 AI、可感知表情的 OCR 和 Snapchat 的 Screenshop 增强服装购物体验

是否曾在照片中看到有人穿着一件炫酷的衬衫或独特的服装，并想知道他们是从哪里买来的？价格是多少？也许您甚至考虑过自己买一件。

2 MIN READ

2024年 4月 22日

借助 NVIDIA TensorRT-LLM 和 NVIDIA Triton 推理服务器提升 Meta Llama 3 性能

我们很高兴地宣布支持 Meta Llama 3 系列模型，通过 NVIDIA TensorRT LLM 加速和优化 LLM 推理性能。

2 MIN READ

2024年 4月 19日

测量多流工作负载的 GPU 占用率

随着新一代产品的推出， NVIDIA GPU 的性能也变得越来越强大。这种提升通常有两种形式。每个流多处理器 (SM) (GPU 的主力)…

3 MIN READ

2024年 4月 2日

使用 NVIDIA TensorRT-LLM 调整和部署 LoRA LLM

大型语言模型 (LLM) 可以从大量文本中学习，并为各种任务和领域生成流畅、一致的文本，从而彻底改变自然语言处理 (NLP)。然而，

7 MIN READ

2024年 3月 18日

借助 NVIDIA NeMo Retriever，将企业数据转换为可行见解

在每个行业和每个工作职能部门，生成式 AI 正在激发组织内部的潜力，它将数据转化为知识，并使员工能够更高效地工作。

2 MIN READ

2024年 3月 7日

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术，将随机噪声逐步塑造为 AI 生成的艺术，

4 MIN READ

2024年 3月 6日

在 NVIDIA AI 推理平台上使用 Stable Diffusion XL 生成令人惊叹的图像

扩散模型正在各行各业中改变创意工作流程。这些模型通过采用降噪扩散技术，将随机噪声逐步塑造为 AI 生成的艺术，

4 MIN READ

2024年 1月 24日

借助 NVIDIA AI 软件构建企业级 AI

在推出 ChatGPT 后，全球各地的企业开始意识到 AI 的优势和功能，并竞相将其应用到工作流程中。随着这种采用的加速，

2 MIN READ

2024年 1月 16日

强大的场景文本检测和识别：简介

识别和识别自然场景和图像中的文本对于视频标题文本识别、检测车载摄像头的标牌、信息检索、场景理解、车牌识别以及识别产品文本等用例变得非常重要。

1 MIN READ

2024年 1月 16日

强大的场景文本检测和识别：实施

要使场景文本检测和识别适用于不规则文本或特定用例，您必须完全控制模型，以便根据用例和数据集执行增量学习或微调。请记住，此工作流是场景理解、

2 MIN READ

2024年 1月 5日

借助 Metaflow 开发 ML 和 AI，并借助 NVIDIA Triton 推理服务器进行部署

将 ML 模型部署到生产环境的方法有很多。有时，模型每天运行一次，以更新数据库中的预测。有时，

3 MIN READ

2024年 1月 4日

借助 H2O.ai 和 NVIDIA 加速端到端工作流程的推理

数据科学家利用生成式 AI和预测分析构建新一代 AI 应用。在金融服务领域，AI 建模和推理可用于多种解决方案，包括用于投资分析的替代数据、

3 MIN READ

2023年 12月 18日

RAG 101：揭秘检索增强生成流程

大型语言模型 (LLM) 在理解和生成类似人类的响应方面具有前所未有的能力，这给世界留下了深刻的印象。

1 MIN READ

2023年 12月 18日

RAG 101：检索增强型生成问题

在设计和部署 RAG 工作流时，数据科学家、AI 工程师、MLOps 工程师和 IT 基础架构专业人员必须考虑各种因素：

2 MIN READ

2023年 3月 29日

利用三维合成数据进行自举目标检测模型训练

训练人工智能模型需要大量的数据。获取大量训练数据可能很困难、耗时且成本高昂。此外，所收集的数据可能无法涵盖各种角落的情况，

4 MIN READ