RAPIDS

2025年 4月 10日
高效扩展 Polars 的 GPU Parquet 读取器
在处理大型数据集时,数据处理工具的性能变得至关重要。 Polars 是一个以速度和效率闻名的开源数据操作库,提供由 cuDF 驱动的 GPU…
2 MIN READ

2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 扫描
随着各行各业企业的数据规模不断增长, Apache Parquet 已成为一种重要的数据存储格式。
3 MIN READ

2025年 3月 11日
在 NVIDIA Grace CPU 上使用 Polars 和 Apache Spark 实现高效 ETL
NVIDIA Grace CPU 超级芯片可为数据中心和云端的 CPU 工作负载提供出色的性能和出色的能效。
3 MIN READ

2025年 3月 6日
在 NVIDIA GPU 上无需更改代码即可加速 Apache Spark ML
适用于 Apache Spark 软件插件的 NVIDIA RAPIDS 加速器 开创了零代码更改用户体验 (UX),
2 MIN READ

2025年 3月 4日
使用 Numba 将 GPU 加速的算法交易模拟提高 100 多倍
量化开发者需要运行回测模拟,以便从损益(P&L)的角度了解金融算法的表现。统计技术对于根据可能的损益路径可视化算法的可能结果非常重要。
3 MIN READ

2025年 2月 27日
借助 NVIDIA KvikIO 实现高性能远程 IO
处理大量数据的工作负载 (尤其是在云端运行的工作负载) 通常会使用对象存储服务 (S3、Google Cloud Storage、
2 MIN READ

2025年 2月 20日
使用 NVIDIA cuDF,pandas 读取 JSON 行文件速度提升100倍
JSON 是一种广泛采用的格式,用于在系统之间 (通常用于 Web 应用和大语言模型 (LLMs)) 以互操作方式运行的基于文本的信息。
3 MIN READ

2025年 2月 13日
使用 NetworkX、Jaccard Similarity 和 cuGraph 预测您下一部最喜欢的电影
随着全球每个人可用的数据量不断增加,消费者做出明智决策的能力也越来越难。幸运的是,对于推荐系统而言,大型数据集是一个非常有用的组件,
3 MIN READ

2025年 2月 6日
适用于数据科学的 GPU 加速入门
在数据科学领域,运营效率是处理日益复杂和大型数据集的关键。GPU 加速已成为现代工作流程的关键,可显著提高性能。
3 MIN READ

2025年 1月 30日
掌握 cudf.pandas Profiler 实现 GPU 加速
在 Python 数据科学领域,pandas 长期以来一直是直观数据操作和分析的首选库。但是,随着数据量的增长,
2 MIN READ

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ

2025年 1月 16日
利用 RAPIDS cuML 加速时间序列预测
时间序列预测是一种强大的数据科学技术,用于根据过去的数据点预测未来值 借助 skforecast 等开源 Python 库,
2 MIN READ

2024年 12月 20日
NVIDIA 黑客松获奖者分享 RAPIDS 加速机器学习工作流程的策略
今年,大约 220 个团队齐聚开放数据科学大会 (ODSC) 西部,参加 NVIDIA 黑客松竞赛,这是一场 24 小时机器学习 (ML)…
3 MIN READ

2024年 12月 20日
利用 RAPIDS 和 Ray 加速 GPU 数据分析
RAPIDS 是一套开源 GPU 加速的数据科学和 AI 库,可通过 Spark 和 Dask 等分布式引擎进行横向扩展。
2 MIN READ

2024年 12月 19日
RAPIDS 24.12 推出基于 PyPI 的 cuDF、适用于 Polar 的 CUDA 统一内存和更快的 GNN
RAPIDS 24.12 将 cuDF 包引入 PyPI,加快了 聚合和从 AWS S3 读取文件的速度,
3 MIN READ

2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ