cuDF

2025年 6月 27日
如何在 Polars GPU 引擎中处理超过 VRAM 的数据
在量化金融、算法交易和欺诈检测等高风险领域,数据从业者经常需要处理数百 GB 的数据,才能快速做出明智的决策。
1 MIN READ

2025年 6月 18日
NVIDIA 在制造和运营领域的 AI 应用:借助 NVIDIA CUDA-X 数据科学加速 ML 模型
从晶圆制造和电路探测到封装芯片测试,NVIDIA 利用数据科学和机器学习来优化芯片制造和运营工作流程。这些阶段会产生 TB 级的数据,
3 MIN READ

2025年 5月 7日
使用 NVIDIA NeMo Curator 构建 Nemotron-CC:一个高质量万亿令牌数据集,用于大型语言模型预训练,源自 Common Crawl
对于想要训练先进的 大语言模型 (LLM) 的企业开发者而言,整理高质量的预训练数据集至关重要。为了让开发者能够构建高度准确的 LLM,
2 MIN READ

2025年 4月 17日
顶级大师专业提示:使用 NVIDIA cuDF-pandas 进行特征工程,在 Kaggle 竞赛中夺冠
在处理表格数据时,特征工程仍然是提高模型准确性的最有效方法之一。与 NLP 和计算机视觉等神经网络可以从原始输入中提取丰富模式的领域不同,
2 MIN READ

2025年 4月 10日
高效扩展 Polars 的 GPU Parquet 读取器
在处理大型数据集时,数据处理工具的性能变得至关重要。 Polars 是一个以速度和效率闻名的开源数据操作库,提供由 cuDF 驱动的 GPU…
2 MIN READ

2025年 2月 20日
使用 NVIDIA cuDF,pandas 读取 JSON 行文件速度提升100倍
JSON 是一种广泛采用的格式,用于在系统之间 (通常用于 Web 应用和大语言模型 (LLMs)) 以互操作方式运行的基于文本的信息。
3 MIN READ

2025年 2月 6日
适用于数据科学的 GPU 加速入门
在数据科学领域,运营效率是处理日益复杂和大型数据集的关键。GPU 加速已成为现代工作流程的关键,可显著提高性能。
3 MIN READ

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ

2024年 12月 19日
RAPIDS 24.12 推出基于 PyPI 的 cuDF、适用于 Polar 的 CUDA 统一内存和更快的 GNN
RAPIDS 24.12 将 cuDF 包引入 PyPI,加快了 聚合和从 AWS S3 读取文件的速度,
3 MIN READ

2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ

2024年 12月 5日
统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持
上一篇文章 中介绍的 是一个 GPU 加速库,可加速 pandas 以实现显著的性能提升,速度最高可提升至原来的 50 倍,
2 MIN READ

2024年 11月 21日
RAPIDS 与 Dask 结合实现多 GPU 数据分析的高效实践指南
随着我们向更密集的计算基础设施迈进,拥有更多的计算、更多的 GPU、加速网络等,多 GPU 训练和分析变得越来越流行。
1 MIN READ

2024年 10月 8日
NVIDIA CUDA-X 现可加速 Polars 数据处理库
Polar 是发展最快的数据分析工具之一,每月的下载量刚刚突破 900 万次。作为现代 DataFrame 库,
1 MIN READ

2024年 9月 17日
由 RAPIDS cuDF 提供支持的 Polars GPU 引擎现已推出公测版
今天,Polars 发布了一款由 RAPIDS cuDF 提供支持的新型 GPU 引擎,可在 NVIDIA GPUs 上将 Polars…
1 MIN READ

2024年 9月 11日
使用 RAPIDS cuDF pandas 加速器模式处理 10 亿行数据
十亿行挑战赛 (One Billion Row Challenge) 是一个有趣的基准测试,旨在展示基本的数据处理操作。
3 MIN READ

2024年 8月 30日
RAPIDS AI 加速制造业预测性维护效率
根据国际自动化协会(ISA)报告,每年有5%的工厂生产因机时间而受到损失。在另一种情况下,各行各业的制造商在全球范围内放弃了大约647亿美元,
3 MIN READ