cuML

2025年 9月 25日

使用 CUDA-X 数据科学加速 GPU 模型训练的方法

在之前关于 AI 在制造和运营中应用的博文中，我们探讨了供应链所面临的独特数据挑战，并介绍了智能特征工程如何显著提升模型性能。

2 MIN READ

2025年 9月 18日

Kaggle 大师级玩家手册：7 种实战验证的表格数据建模技术

在数百场 Kaggle 比赛中，我们不断优化了这套 BLUEPRINT，无论面对的是数百万行数据、缺失值，还是与训练数据截然不同的测试集，

3 MIN READ

2025年 9月 17日

NVIDIA RAPIDS 25.08 版本新增 cuML 分析器、Polars GPU 引擎更新、增加算法支持及更多功能

RAPIDS 25.08 版本持续突破极限，新增多项功能，进一步提升了加速数据科学的易用性和可扩展性，包括：请在下方详细了解新增功能。

3 MIN READ

2025年 7月 17日

大规模特征工程：利用 NVIDIA CUDA-X 数据科学优化半导体制造的机器学习模型

在上一篇博文中，我们介绍了芯片制造和运营中的预测建模设置，重点介绍了数据集不平衡等常见挑战，以及对更细致的评估指标的需求。

2 MIN READ

2025年 6月 18日

NVIDIA 在制造和运营领域的 AI 应用：借助 NVIDIA CUDA-X 数据科学加速 ML 模型

从晶圆制造和电路探测到封装芯片测试，NVIDIA 利用数据科学和机器学习来优化芯片制造和运营工作流程。这些阶段会产生 TB 级的数据，

3 MIN READ

2025年 6月 5日

利用 NVIDIA cuML 中的森林推理库加速树模型推理

树集成模型仍然是表格数据的首选，因为它们准确、训练成本相对较低且速度快。但是，如果您需要低于 10 毫秒的延迟或每秒数百万次的预测，

3 MIN READ

2025年 5月 22日

特级大师专业提示：使用 cuML 通过堆叠夺得 Kaggle 竞赛冠军

堆叠是一种先进的表格数据建模技术，通过结合多个不同模型的预测来实现高性能。利用 GPU 的计算速度，可以高效地训练大量模型。

2 MIN READ

2025年 5月 7日

使用 NVIDIA NeMo Curator 构建 Nemotron-CC：一个高质量万亿令牌数据集，用于大型语言模型预训练，源自 Common Crawl

对于想要训练先进的大语言模型 (LLM) 的企业开发者而言，整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM，

2 MIN READ

2025年 5月 1日

借助超参数优化实现堆叠泛化：使用 NVIDIA cuML 在15分钟内最大化准确性

堆叠泛化是机器学习 (ML) 工程师广泛使用的技术，通过组合多个模型来提高整体预测性能。另一方面，超参数优化 (HPO)…

3 MIN READ

2025年 3月 18日

NVIDIA cuML 为 scikit-learn 带来零代码更改加速

Scikit-learn 是应用最广泛的 ML 库，因其 API 简单、算法多样且与 pandas 和 NumPy 等热门 Python…

2 MIN READ

2025年 1月 16日

利用 RAPIDS cuML 加速时间序列预测

时间序列预测是一种强大的数据科学技术，用于根据过去的数据点预测未来值借助 skforecast 等开源 Python 库，

2 MIN READ

2024年 12月 12日

利用 RAPIDS cuML 和 GPU 加速提升多标签分类性能

现代分类工作流程通常需要将单个记录和数据点分类为多个类别，而不仅仅是分配单个标签。借助 scikit-learn 等开源 Python 库，

1 MIN READ

2024年 11月 14日

NVIDIA RAPIDS 加速大型数据集的因果关系推理

随着消费者应用生成的数据比以前更多，企业开始采用观察数据的因果关系推理方法，以帮助阐明应用的各个组件的更改如何影响关键业务指标。

1 MIN READ

2024年 10月 31日

RAPIDS cuML 助力 GPU 实现 UMAP 的高速扩展

UMAP 是一种常用的降维算法，用于生物信息学、NLP 主题建模和 ML 预处理等领域。它的工作原理是创建 k 近邻（k…

3 MIN READ

2023年 10月 13日

借助 GPU-CPU 融合大规模增强图形分析，实现 100 倍性能

图形是许多现代数据和分析功能的基础，可在不同的数据资产中查找人、地点、事物、事件和位置之间的关系。根据一项研究，到 2025 年，

3 MIN READ

2023年 6月 27日

使用 RAPIDS-singlecell 进行 GPU 加速的单细胞 RNA 分析

单细胞测序已成为生物医学研究中最突出的技术之一。它在细胞水平上破译转录组和表观基因组变化的能力使研究人员获得了有价值的新见解。因此，

5 MIN READ