LLM 技术
2025年 1月 9日
宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集
NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 ,
1 MIN READ
2024年 12月 17日
利用 NVIDIA NeMo-Aligner 进行监督式微调的数据高效知识蒸馏
知识蒸馏是一种将更大的教师模型的知识转移到更小的学生模型的方法,理想情况下可生成紧凑、易于部署的学生,且准确度与教师相当。
2 MIN READ
2024年 12月 17日
开发具有高效数据存储的多语种和跨语言信息检索系统
高效的文本检索对于搜索、问答、语义文本相似性、摘要和商品推荐等各种信息检索应用至关重要。它还在检索增强生成(RAG)技术中发挥着关键作用,
2 MIN READ
2024年 12月 16日
对大型语言模型驱动的知识图谱的洞察、技术和评估
数据是现代企业的生命线,推动着从创新到战略决策的方方面面。然而,随着企业组织积累了越来越多的信息 (从技术文档到内部沟通),
5 MIN READ
2024年 11月 15日
掌握 LLM 技术:数据预处理
大语言模型(LLMs) 的出现标志着各行业利用人工智能(AI)增强运营和服务的方式发生了重大转变。通过自动化日常任务和简化流程,
2 MIN READ
2024年 11月 12日
聚焦:Dataloop 借助 NVIDIA NIM 加速 LLM 的多模态数据准备流程
在快速发展的人工智能环境中,为大语言模型(LLMs)准备高质量数据集已成为一项严峻的挑战。这直接影响到模型的准确性、性能,
3 MIN READ
2024年 10月 28日
LLM 模型合并入门指南
自定义 大语言模型(LLM) 时,组织面临的一个挑战是需要运行多个实验,而这些实验只能产生一个有用的模型。虽然实验成本通常较低,
2 MIN READ
2024年 10月 24日
利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心
安全运营中心(SOC)分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全,他们的任务是仔细检查传入的噪音,分拣出误报,
1 MIN READ
2024年 10月 24日
利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心
安全运营中心(SOC)分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全,他们的任务是仔细检查传入的噪音,分拣出误报,
1 MIN READ
2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ
2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初发布于 2024 年 8 月 21 日,但已根据当前数据进行了修订。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ
2024年 9月 18日
NVIDIA 在领先的网络安全会议上展示 AI 安全专业知识
每年 8 月,成千上万的安全专业人员都会参加最前沿的安全会议 Black Hat USA 和 DEF CON。这一年,
2 MIN READ
2024年 9月 11日
聚焦:xpander AI 为 NVIDIA NIM 应用配备 Agentic 工具
为智能体 AI 应用配备工具将引领 AI 进入下一阶段。通过使自主智能体和其他 AI 应用能够获取实时数据、执行操作,并与外部系统交互,
3 MIN READ
2024年 8月 21日
Mistral-NeMo-Minitron 8B 基础模型实现准确性巅峰
上个月,NVIDIA 和 Mistral AI 推出了 Mistral NeMo 12B,这是一款领先的先进的大型语言模型(LLM)。
1 MIN READ
2024年 8月 14日
如何在 NVIDIA Llama-3.1-Minitron 4B 模型上修剪和提炼 Llama-3.1 8B
由于大型语言模型(LLM)的有效性和通用性,它们现在已经成为自然语言处理和理解领域的主导力量。LLM(例如 Llama 3.1…
4 MIN READ
2024年 7月 8日
使用 NVIDIA NIM 实现多语种大语言模型部署
对于在当今全球化商业环境中运营的企业而言,多语种大型语言模型(LLM)的重要性与日俱增。随着企业跨越国界和文化扩展业务,
4 MIN READ