LLM 技术

2025年 2月 25日
定义 LLM 红色团队
在一项活动中,人们为生成式 AI 技术 (例如大语言模型 (LLMs)) 提供输入,以确定输出是否会偏离可接受的标准。
1 MIN READ

2025年 2月 12日
使用 NVIDIA NeMo 框架进行 LLM 模型剪枝和知识蒸馏
模型剪枝和知识蒸馏是功能强大且经济高效的策略,用于从最初较大的同级获得较小的语言模型。 在一篇“ 如何剪枝和蒸馏 Llama-3.1 8B ”…
4 MIN READ

2025年 1月 29日
掌握 LLM 技术:评估
评估大语言模型(LLMs) 和 检索增强生成(RAG) 系统是一个复杂而微妙的过程,反映了这些系统的复杂性和多面性。 与传统机器学习(ML)…
2 MIN READ

2025年 1月 16日
借助 iGenius 和 NVIDIA DGX 云,继续为主权 AI 和受监管行业预训练先进的 LLM
近年来,大语言模型(LLMs)在推理、代码生成、机器翻译和摘要等领域取得了非凡的进步。然而,尽管基础模型具有先进的功能,
4 MIN READ

2025年 1月 9日
宣布推出 Nemotron-CC:用于 LLM 预训练的万亿级英语语言数据集
NVIDIA 很高兴地宣布发布 Nemotron-CC,这是一种包含 6.3 万亿个令牌的 英语语言 Common Crawl 数据集 ,
1 MIN READ

2024年 12月 17日
利用 NVIDIA NeMo-Aligner 进行监督式微调的数据高效知识蒸馏
知识蒸馏是一种将更大的教师模型的知识转移到更小的学生模型的方法,理想情况下可生成紧凑、易于部署的学生,且准确度与教师相当。
2 MIN READ

2024年 12月 17日
开发具有高效数据存储的多语种和跨语言信息检索系统
高效的文本检索对于搜索、问答、语义文本相似性、摘要和商品推荐等各种信息检索应用至关重要。它还在检索增强生成(RAG)技术中发挥着关键作用,
2 MIN READ

2024年 12月 16日
对大型语言模型驱动的知识图谱的洞察、技术和评估
数据是现代企业的生命线,推动着从创新到战略决策的方方面面。然而,随着企业组织积累了越来越多的信息 (从技术文档到内部沟通),
5 MIN READ

2024年 11月 15日
掌握 LLM 技术:数据预处理
大语言模型(LLMs) 的出现标志着各行业利用人工智能(AI)增强运营和服务的方式发生了重大转变。通过自动化日常任务和简化流程,
2 MIN READ

2024年 11月 12日
聚焦:Dataloop 借助 NVIDIA NIM 加速 LLM 的多模态数据准备流程
在快速发展的人工智能环境中,为大语言模型(LLMs)准备高质量数据集已成为一项严峻的挑战。这直接影响到模型的准确性、性能,
3 MIN READ

2024年 10月 28日
LLM 模型合并入门指南
自定义 大语言模型(LLM) 时,组织面临的一个挑战是需要运行多个实验,而这些实验只能产生一个有用的模型。虽然实验成本通常较低,
2 MIN READ

2024年 10月 24日
利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心
安全运营中心(SOC)分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全,他们的任务是仔细检查传入的噪音,分拣出误报,
1 MIN READ

2024年 10月 24日
利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心
安全运营中心(SOC)分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全,他们的任务是仔细检查传入的噪音,分拣出误报,
1 MIN READ

2024年 10月 22日
利用 NVIDIA Triton 和 NVIDIA TensorRT-LLM 及 Kubernetes 实现 LLM 扩展
大语言模型 (LLMs) 已广泛应用于聊天机器人、内容生成、摘要、分类、翻译等领域。State-of-the-art LLMs 和基础模型如…
5 MIN READ

2024年 10月 8日
Mistral-NeMo-Minitron 8B 模型提供超高精度
本文最初发布于 2024 年 8 月 21 日,但已根据当前数据进行了修订。 最近,NVIDIA 和 Mistral AI 推出了…
3 MIN READ