cuDF

2025年 4月 10日
高效扩展 Polars 的 GPU Parquet 读取器
在处理大型数据集时,数据处理工具的性能变得至关重要。 Polars 是一个以速度和效率闻名的开源数据操作库,提供由 cuDF 驱动的 GPU…
2 MIN READ

2025年 2月 20日
使用 NVIDIA cuDF,pandas 读取 JSON 行文件速度提升100倍
JSON 是一种广泛采用的格式,用于在系统之间 (通常用于 Web 应用和大语言模型 (LLMs)) 以互操作方式运行的基于文本的信息。
3 MIN READ

2025年 2月 6日
适用于数据科学的 GPU 加速入门
在数据科学领域,运营效率是处理日益复杂和大型数据集的关键。GPU 加速已成为现代工作流程的关键,可显著提高性能。
3 MIN READ

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ

2024年 12月 19日
RAPIDS 24.12 推出基于 PyPI 的 cuDF、适用于 Polar 的 CUDA 统一内存和更快的 GNN
RAPIDS 24.12 将 cuDF 包引入 PyPI,加快了 聚合和从 AWS S3 读取文件的速度,
3 MIN READ

2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ

2024年 12月 5日
统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持
上一篇文章 中介绍的 是一个 GPU 加速库,可加速 pandas 以实现显著的性能提升,速度最高可提升至原来的 50 倍,
2 MIN READ

2024年 11月 21日
RAPIDS 与 Dask 结合实现多 GPU 数据分析的高效实践指南
随着我们向更密集的计算基础设施迈进,拥有更多的计算、更多的 GPU、加速网络等,多 GPU 训练和分析变得越来越流行。
1 MIN READ

2024年 10月 8日
NVIDIA CUDA-X 现可加速 Polars 数据处理库
Polar 是发展最快的数据分析工具之一,每月的下载量刚刚突破 900 万次。作为现代 DataFrame 库,
1 MIN READ

2024年 9月 17日
由 RAPIDS cuDF 提供支持的 Polars GPU 引擎现已推出公测版
今天,Polars 发布了一款由 RAPIDS cuDF 提供支持的新型 GPU 引擎,可在 NVIDIA GPUs 上将 Polars…
1 MIN READ

2024年 9月 11日
使用 RAPIDS cuDF pandas 加速器模式处理 10 亿行数据
十亿行挑战赛 (One Billion Row Challenge) 是一个有趣的基准测试,旨在展示基本的数据处理操作。
3 MIN READ

2024年 8月 30日
RAPIDS AI 加速制造业预测性维护效率
根据国际自动化协会(ISA)报告,每年有5%的工厂生产因机时间而受到损失。在另一种情况下,各行各业的制造商在全球范围内放弃了大约647亿美元,
3 MIN READ

2024年 8月 21日
使用 Co-Visitation 矩阵和 RAPIDS cuDF 构建高效的推荐系统
推荐系统在跨各种平台实现个性化用户体验方面发挥着至关重要的作用。这些系统旨在根据用户过去的行为和偏好预测和推荐用户可能与之交互的商品。
4 MIN READ

2024年 8月 9日
RAPIDS cuDF 统一显存技术使大型数据集上的 pandas 运行速度最高提升 30 倍
NVIDIA 已发布 RAPIDS cuDF 统一显存和文本数据处理功能,帮助数据科学家在严苛的工作负载中处理更大、
2 MIN READ

2024年 5月 14日
Databricks 上的 RAPIDS: GPU 加速数据处理指南
在当今数据驱动的环境中,最大限度地提高数据处理和分析的性能和效率至关重要。虽然许多 Databricks 用户熟悉使用 GPU…
3 MIN READ

2024年 5月 14日
RAPIDS cuDF 在 Google Colab 上瞬间加速 pandas 达 50 倍
在谷歌 I/O’24 上,谷歌人工智能倡导主管 Laurence Moroney 宣布:RAPID cuDF 现已集成到 Google…
1 MIN READ