Posts by Matt Ahrens
数据科学
2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 扫描
随着各行各业企业的数据规模不断增长, Apache Parquet 已成为一种重要的数据存储格式。
3 MIN READ
数据科学
2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ