Gregory Kimball

Gregory Kimball 是 NVIDIA 的软件工程经理,在 RAPIDS 团队工作。 Gregory 负责 libcudf 的开发, libcudf 是一个用于柱状数据处理的 CUDA / C ++库,为 RAPIDS cuDF 提供动力。格雷戈里拥有加州理工学院应用物理学博士学位。

Posts by Gregory Kimball

数据科学

使用 RAPIDS cuDF pandas 加速器模式处理 10 亿行数据

十亿行挑战赛 (One Billion Row Challenge) 是一个有趣的基准测试,旨在展示基本的数据处理操作。 3 MIN READ
数据科学

使用 RAPIDS 的 Parquet 字符串数据的编码和压缩指南

Parquet Writer 提供了默认关闭的编码和压缩选项。启用这些选项可以为数据提供更好的无损压缩, 3 MIN READ
数据科学

在 RAPIDS libcudf 中使用嵌入式数据类型简化 ETL 工作流程

嵌入式数据类型是一种表示列式数据中分层关系的便捷方式。它们经常用于 提取、转换、加载(ETL)在商业智能领域的工作负载、推荐系统、网络安全、 2 MIN READ
数据科学

GPU 加速的 RAPID JSON 数据处理

JSON 是一种广泛采用的基于文本的信息格式,可在系统之间互操作,最常见于 web 应用程序。虽然 JSON 格式是人类可读的, 3 MIN READ
数据科学

在 RAPIDS libcudf 中掌握字符串转换

字符串数据的高效处理对于许多数据科学应用至关重要。为了从字符串数据中提取有价值的信息, 5 MIN READ
数据科学

使用 GPUDirect 存储和 RAPIDS cuDF 提高数据摄取吞吐量

如果您从事数据分析工作,您就会知道数据摄取通常是数据预处理工作流的瓶颈。由于数据量大且常用格式复杂, 3 MIN READ