Posts by Gregory Kimball
数据科学
2025年 10月 6日
GPU 原生 Velox 和 NVIDIA cuDF 加速大规模数据分析
随着工作负载规模的扩大以及对高效数据处理需求的提升,相比基于 CPU 的系统,采用 GPU 加速的数据库和查询引擎在性价比方面展现出显著优势。
2 MIN READ
数据科学
2025年 8月 7日
使用 JIT 编译在 cuDF 中高效转换
RAPIDS cuDF 提供了一系列用于使用 GPU 处理数据的 ETL 算法。对于 pandas 用户,
3 MIN READ
数据中心/云端
2025年 3月 11日
在 NVIDIA Grace CPU 上使用 Polars 和 Apache Spark 实现高效 ETL
NVIDIA Grace CPU 超级芯片可为数据中心和云端的 CPU 工作负载提供出色的性能和出色的能效。
3 MIN READ
数据科学
2025年 2月 20日
使用 NVIDIA cuDF,pandas 读取 JSON 行文件速度提升100倍
JSON 是一种广泛采用的格式,用于在系统之间 (通常用于 Web 应用和大语言模型 (LLMs)) 以互操作方式运行的基于文本的信息。
3 MIN READ
数据科学
2024年 9月 11日
使用 RAPIDS cuDF pandas 加速器模式处理 10 亿行数据
十亿行挑战赛 (One Billion Row Challenge) 是一个有趣的基准测试,旨在展示基本的数据处理操作。
3 MIN READ
数据科学
2024年 7月 17日
使用 RAPIDS 的 Parquet 字符串数据的编码和压缩指南
Parquet Writer 提供了默认关闭的编码和压缩选项。启用这些选项可以为数据提供更好的无损压缩,
3 MIN READ