数据科学
2025年 1月 13日
借助 NVIDIA BioNeMo Blueprint 加速蛋白质工程中的生成式蛋白质粘结剂设计
设计一种能在药物研发中专门结合标的治疗性蛋白质是一项艰巨的挑战。传统工作流程通常是一个艰苦的试错过程,需要对数千个候选项进行迭代,
1 MIN READ
2025年 1月 13日
评估 GenMol 作为用于分子生成的通用基础模型
传统的计算药物研发几乎完全依赖于高度特定于任务的计算模型来识别命中率和优化潜在客户。使这些专业模型适应新任务需要大量的时间、
2 MIN READ
2025年 1月 13日
使用 NVIDIA NeMo Curator 提高生成式 AI 模型的准确性
在快速发展的人工智能领域,用于训练模型的数据质量至关重要。高质量数据可确保模型准确、可靠,并且能够在各种应用中很好地泛化。
1 MIN READ
2024年 12月 20日
NVIDIA 黑客松获奖者分享 RAPIDS 加速机器学习工作流程的策略
今年,大约 220 个团队齐聚开放数据科学大会 (ODSC) 西部,参加 NVIDIA 黑客松竞赛,这是一场 24 小时机器学习 (ML)…
3 MIN READ
2024年 12月 20日
利用 RAPIDS 和 Ray 加速 GPU 数据分析
RAPIDS 是一套开源 GPU 加速的数据科学和 AI 库,可通过 Spark 和 Dask 等分布式引擎进行横向扩展。
2 MIN READ
2024年 12月 19日
RAPIDS 24.12 推出基于 PyPI 的 cuDF、适用于 Polar 的 CUDA 统一内存和更快的 GNN
RAPIDS 24.12 将 cuDF 包引入 PyPI,加快了 聚合和从 AWS S3 读取文件的速度,
3 MIN READ
2024年 12月 19日
使用 NVIDIA NeMo Curator 新分类器模型增强您的训练数据
分类器模型专门用于将数据分类为预定义的组或类,在优化数据处理流程以微调和预训练生成式 AI 模型方面发挥着关键作用。
3 MIN READ
2024年 12月 18日
利用 XGBoost 中的 CUDA 加速同态加密实现联邦学习数据隐私安全性
XGBoost 是一种广泛用于表格数据建模的机器学习算法。为了将 XGBoost 模型从单站点学习扩展到多站点协作训练,
3 MIN READ
2024年 12月 16日
2024 年热门文章:NVIDIA NIM、语言模型突破和数据科学优化的精要
对于使用 NVIDIA 技术的开发者、研究人员和创新者来说,2024 年又是具有里程碑意义的一年。
2 MIN READ
2024年 12月 12日
利用 RAPIDS cuML 和 GPU 加速提升多标签分类性能
现代分类工作流程通常需要将单个记录和数据点分类为多个类别,而不仅仅是分配单个标签。 借助 scikit-learn 等开源 Python 库,
1 MIN READ
2024年 12月 5日
统一虚拟内存利用 RAPIDS cuDF 为 pandas 提供强力支持
上一篇文章 中介绍的 是一个 GPU 加速库,可加速 pandas 以实现显著的性能提升,速度最高可提升至原来的 50 倍,
2 MIN READ
2024年 11月 21日
聚焦:借助 AVEVA 动态模拟和 NVIDIA Raptor 推进自动驾驶操作
工业工程师正在利用人工智能构建先进的流程模拟解决方案,并加快能源、电力和化学行业实现完全自主运营的进程。
2 MIN READ
2024年 11月 21日
RAPIDS 与 Dask 结合实现多 GPU 数据分析的高效实践指南
随着我们向更密集的计算基础设施迈进,拥有更多的计算、更多的 GPU、加速网络等,多 GPU 训练和分析变得越来越流行。
1 MIN READ
2024年 11月 19日
NVIDIA NeMo Curator 实现高质量越南语数据处理
开源大语言模型(LLMs) 在英语方面表现出色,但难以与其他语言(尤其是东南亚语言)搭配使用。这主要是由于缺乏这些语言的训练数据、
6 MIN READ
2024年 11月 18日
借助 NVIDIA cuPyNumeric,将 NumPy 无缝扩展从笔记本电脑到超级计算机
Python 是数据科学、机器学习和数值计算领域最常用的编程语言。它在科学家和研究人员中日益受欢迎。在 Python 生态系统中,
4 MIN READ
2024年 11月 18日
利用 NVIDIA ALCHEMI 实现 AI 驱动材料发现的革命性突破
事实证明,AI 可发挥倍增效应,帮助创造一种未来,科学家可以设计全新材料,而工程师可以将这些设计无缝转换为生产计划,而这一切都无需涉足实验室。
3 MIN READ