RAPIDS

2025年 8月 22日
NVIDIA 硬件创新和开源贡献正在塑造 AI
Cosmos、DeepSeek、Gemma、GPT-OSS、Llama、Nemotron、Phi、
2 MIN READ

2025年 8月 22日
如何发现 (并修复) pandas 工作流中的 5 个常见性能瓶颈
数据加载缓慢、内存消耗大的连接操作以及长时间运行的任务,是每位 Python 开发者都会面临的问题。它们不仅浪费了宝贵的时间,
2 MIN READ

2025年 8月 7日
在单个 NVIDIA Grace Hopper 超级芯片上使用 XGBoost 3.0 训练 TB 级数据集
梯度提升决策树 (GBDT) 驱动着从实时欺诈过滤到 PB 级需求预测的各种功能。由于其先进的准确性、
2 MIN READ

2025年 8月 7日
使用 JIT 编译在 cuDF 中高效转换
RAPIDS cuDF 提供了一系列用于使用 GPU 处理数据的 ETL 算法。对于 pandas 用户,
3 MIN READ

2025年 8月 1日
7 种可即时加速 Python 数据科学工作流程的插入式替代方案
您已经经历过。您编写了完美的 Python 脚本,在示例 CSV 上对其进行了测试,一切都很完美。但是,
2 MIN READ

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理
将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ,
2 MIN READ

2025年 7月 18日
3 个 pandas 工作流在大型数据集上严重变慢,直到启用了 GPU 加速
如果您使用 pandas,您可能已经撞到了墙壁。正是在这个时刻,您值得信赖的工作流程在处理较小的数据集时表现出色,在处理大型数据集时陷入停顿。
1 MIN READ

2025年 7月 17日
大规模特征工程:利用 NVIDIA CUDA-X 数据科学优化半导体制造的机器学习模型
在上一篇博文中,我们介绍了芯片制造和运营中的预测建模设置,重点介绍了数据集不平衡等常见挑战,以及对更细致的评估指标的需求。
2 MIN READ

2025年 7月 3日
RAPIDS 新增 GPU Polars 串流、统一 GNN API 和零代码 ML 加速功能
RAPIDS 是一套用于 Python 数据科学的 NVIDIA CUDA-X 库,发布了 25.06 版本,引入了令人兴奋的新功能。
2 MIN READ

2025年 6月 27日
如何在 Polars GPU 引擎中处理超过 VRAM 的数据
在量化金融、算法交易和欺诈检测等高风险领域,数据从业者经常需要处理数百 GB 的数据,才能快速做出明智的决策。
1 MIN READ

2025年 6月 18日
NVIDIA 在制造和运营领域的 AI 应用:借助 NVIDIA CUDA-X 数据科学加速 ML 模型
从晶圆制造和电路探测到封装芯片测试,NVIDIA 利用数据科学和机器学习来优化芯片制造和运营工作流程。这些阶段会产生 TB 级的数据,
3 MIN READ

2025年 6月 12日
借助 RAPIDS 单细胞技术推动十亿细胞分析和生物学突破
细胞生物学和虚拟细胞模型的未来取决于大规模测量和分析数据。在过去 10 年里,单细胞实验一直以惊人的速度增长,从数百个细胞开始,
2 MIN READ

2025年 6月 5日
利用 NVIDIA cuML 中的森林推理库加速树模型推理
树集成模型仍然是表格数据的首选,因为它们准确、训练成本相对较低且速度快。但是,如果您需要低于 10 毫秒的延迟或每秒数百万次的预测,
3 MIN READ

2025年 5月 29日
RAPIDS 实现零代码更改加速、IO 性能提升和核外 XGBoost 加速
在过去的两个版本中,RAPIDS 为 Python 机器学习引入了零代码更改加速、巨大的 IO 性能提升、大于内存的 XGBoost 训练、
3 MIN READ

2025年 5月 22日
特级大师专业提示:使用 cuML 通过堆叠夺得 Kaggle 竞赛冠军
堆叠是一种先进的表格数据建模技术,通过结合多个不同模型的预测来实现高性能。利用 GPU 的计算速度,可以高效地训练大量模型。
2 MIN READ

2025年 5月 19日
聚焦:Atgenomix SeqsLab 提升健康组学分析以支持精准医疗
在传统的临床医学实践中,治疗决策通常基于一般准则、以往经验和试错方法。如今,随着电子病历 (EMRs) 和基因组数据的访问,
2 MIN READ