cuML

2025年 7月 17日
大规模特征工程:利用 NVIDIA CUDA-X 数据科学优化半导体制造的机器学习模型
在上一篇博文中,我们介绍了芯片制造和运营中的预测建模设置,重点介绍了数据集不平衡等常见挑战,以及对更细致的评估指标的需求。
2 MIN READ

2025年 6月 18日
NVIDIA 在制造和运营领域的 AI 应用:借助 NVIDIA CUDA-X 数据科学加速 ML 模型
从晶圆制造和电路探测到封装芯片测试,NVIDIA 利用数据科学和机器学习来优化芯片制造和运营工作流程。这些阶段会产生 TB 级的数据,
3 MIN READ

2025年 6月 5日
利用 NVIDIA cuML 中的森林推理库加速树模型推理
树集成模型仍然是表格数据的首选,因为它们准确、训练成本相对较低且速度快。但是,如果您需要低于 10 毫秒的延迟或每秒数百万次的预测,
3 MIN READ

2025年 5月 22日
特级大师专业提示:使用 cuML 通过堆叠夺得 Kaggle 竞赛冠军
堆叠是一种先进的表格数据建模技术,通过结合多个不同模型的预测来实现高性能。利用 GPU 的计算速度,可以高效地训练大量模型。
2 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl
对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM,
2 MIN READ

2025年 5月 1日
借助超参数优化实现堆叠泛化:使用 NVIDIA cuML 在15分钟内最大化准确性
堆叠泛化是机器学习 (ML) 工程师广泛使用的技术,通过组合多个模型来提高整体预测性能。另一方面,超参数优化 (HPO)…
3 MIN READ

2025年 3月 18日
NVIDIA cuML 为 scikit-learn 带来零代码更改加速
Scikit-learn 是应用最广泛的 ML 库,因其 API 简单、算法多样且与 pandas 和 NumPy 等热门 Python…
2 MIN READ

2025年 1月 16日
利用 RAPIDS cuML 加速时间序列预测
时间序列预测是一种强大的数据科学技术,用于根据过去的数据点预测未来值 借助 skforecast 等开源 Python 库,
2 MIN READ

2024年 12月 12日
利用 RAPIDS cuML 和 GPU 加速提升多标签分类性能
现代分类工作流程通常需要将单个记录和数据点分类为多个类别,而不仅仅是分配单个标签。 借助 scikit-learn 等开源 Python 库,
1 MIN READ

2024年 11月 14日
NVIDIA RAPIDS 加速大型数据集的因果关系推理
随着消费者应用生成的数据比以前更多,企业开始采用观察数据的因果关系推理方法,以帮助阐明应用的各个组件的更改如何影响关键业务指标。
1 MIN READ

2024年 10月 31日
RAPIDS cuML 助力 GPU 实现 UMAP 的高速扩展
UMAP 是一种常用的降维算法,用于生物信息学、NLP 主题建模和 ML 预处理等领域。它的工作原理是创建 k 近邻(k…
3 MIN READ

2023年 10月 13日
借助 GPU-CPU 融合大规模增强图形分析,实现 100 倍性能
图形是许多现代数据和分析功能的基础,可在不同的数据资产中查找人、地点、事物、事件和位置之间的关系。根据一项研究,到 2025 年,
3 MIN READ

2023年 6月 27日
使用 RAPIDS-singlecell 进行 GPU 加速的单细胞 RNA 分析
单细胞测序已成为生物医学研究中最突出的技术之一。它在细胞水平上破译转录组和表观基因组变化的能力使研究人员获得了有价值的新见解。因此,
5 MIN READ

2023年 5月 19日
用 RAPIDS 生成用于加速短期价格预测的限价订单簿数据集
在高频交易的世界里,成千上万的市场参与者每天都在互动。据该报报道,事实上,高频交易占美国股票交易量的一半以上高频交易同步金融市场价格。
3 MIN READ

2023年 4月 4日
使用 Dataiku 和 NVIDIA Data Science 进行主题建模和图像分类
这个Dataiku platform日常人工智能简化了深度学习。用例影响深远,从图像分类到对象检测和自然语言处理( NLP )。
4 MIN READ

2023年 3月 22日
使用 RAPIDS RAFT 进行机器学习和数据分析的可重用计算模式
在许多数据分析和机器学习算法中,计算瓶颈往往来自控制端到端性能的一小部分步骤。这些步骤的可重用解决方案通常需要低级别的基元,
4 MIN READ