Conversational AI

2025年 1月 9日
宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集
NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 ,
1 MIN READ

2024年 12月 20日
利用 NVIDIA NIM 微服务构建生成式 AI 医疗设备训练助手
医疗设备创新不断加速,每年获得 FDA 批准的数量都创下新高。向临床医生和患者介绍这些全新或更新的设备时,他们需要接受培训,以正确、
2 MIN READ

2024年 12月 16日
借助 WebAssembly 实现沙箱 Agentic AI 工作流
代理 AI 工作流通常 涉及执行由 大语言模型 (LLM) 生成的代码,以执行创建数据可视化等任务。但是,此代码应在安全环境中清理和执行,
2 MIN READ

2024年 11月 22日
Hymba 混合头架构提高小型语言模型性能
Transformer 及其基于注意力的架构,凭借强大的性能、并行化功能以及通过键值 (KV) 缓存进行的长期召回,已成为语言模型 (LM)…
5 MIN READ

2024年 11月 19日
使用 NVIDIA NIM 和 LangChain 创建自定义 Slackbot LLM 智能体
在现代商业的动态世界中,通信和高效的工作流对成功至关重要,人工智能(AI)解决方案已经成为竞争优势。
3 MIN READ

2024年 10月 28日
NVIDIA 中构建 RAG 基问答大语言模型工作流程
利用检索增强生成(RAG)技术快速开发解决方案,助力问答 LLM 工作流程,由此催生出新型系统架构。NVIDIA 将 AI 用于内部运营,
3 MIN READ

2024年 10月 23日
借助 NVIDIA NIM 智能体蓝图创建客户服务 AI 虚拟助理的三大核心组件
在当今快节奏的商业环境中,提供卓越的客户服务已不再是一种好事情,而是一种必要条件。无论是解决技术问题、解决计费问题,还是提供服务更新,
2 MIN READ

2024年 10月 22日
多代理 AI 和 GPU 驱动的声音转文本技术创新
自动音频字幕 (Automated Audio Captioning) 任务的核心是从音频输入中生成自然语言描述。鉴于输入 (音频) 和输出…
2 MIN READ

2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ

2024年 10月 21日
IBM 全新推出的 GRANITE 3.0 生成式 AI 模型:小体积、高准确度、高效率
今天,IBM 发布了第三代 IBM Granite,这是一个开放语言模型和辅助工具的集合。前几代 Granite 专注于特定领域的用例;
2 MIN READ

2024年 10月 16日
借助 NVIDIA 云原生堆栈实现 AI 应用开发简化
在快速发展的 AI 和数据科学领域,对可扩展、高效且灵活的基础设施的需求从未如此高。传统基础设施通常难以满足现代 AI 工作负载的需求,
1 MIN READ

2024年 10月 1日
使用 NVIDIA AI 端点和 Ragas 对医疗 RAG 的评估分析
在快速发展的医学领域,尖端技术的集成对于增强患者护理和推进研究至关重要。其中一项创新是 检索增强生成(RAG),
3 MIN READ

2024年 9月 25日
NVIDIA NIM 智能体蓝图助力 AI 应用打造数字人机交互界面
为客户提供高质量的服务仍然是各行各业企业的首要任务,从回答问题和解决问题到促进在线订单。随着企业在全球范围内扩展运营并扩展产品以竞争,
1 MIN READ

2024年 9月 25日
Llama 3.2 加速部署从边缘到云端实现提速
扩展开源 Meta Llama 模型集合,Llama 3.2 集合包括视觉语言模型(VLM)、小语言模型(SLM)和更新版的 Llama…
2 MIN READ

2024年 9月 24日
借助 NVIDIA NeMo 实现出色的 ASR 模型 10 倍加速
NVIDIA NeMo 持续开发了设定行业基准的 自动语音识别(ASR) 模型,尤其是在 Hugging Face Open ASR 排行榜…
4 MIN READ

2024年 9月 18日
使用 NVIDIA NIM 微服务实现语音和翻译功能,快速赋予应用语音能力
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自行托管的 GPU 加速推理微服务提供容器,用于跨云、
3 MIN READ