Apache Spark

2025年 7月 23日
在 Azure 上使用 Apache Spark 和 NVIDIA AI 进行无服务器分布式数据处理
将大量文本库转换为数字表示 (称为嵌入) 的过程对于生成式 AI 至关重要。从语义搜索和推荐引擎到检索增强生成 (RAG) ,
2 MIN READ

2025年 5月 19日
聚焦:Atgenomix SeqsLab 提升健康组学分析以支持精准医疗
在传统的临床医学实践中,治疗决策通常基于一般准则、以往经验和试错方法。如今,随着电子病历 (EMRs) 和基因组数据的访问,
2 MIN READ

2025年 5月 15日
使用 GPU 预测 Apache Spark 的性能
大数据分析领域正在不断寻找加速处理和降低基础设施成本的方法。Apache Spark 已成为用于横向扩展分析的领先平台,可处理 ETL、
2 MIN READ

2025年 5月 8日
云端 Apache Spark 加速深度学习和大语言模型推理
Apache Spark 是用于大数据处理和分析的行业领先平台。随着非结构化数据(documents、emails、
4 MIN READ

2025年 4月 3日
使用 GPU 加速 Apache Spark 上的 Apache Parquet 扫描
随着各行各业企业的数据规模不断增长, Apache Parquet 已成为一种重要的数据存储格式。
3 MIN READ

2025年 3月 11日
在 NVIDIA Grace CPU 上使用 Polars 和 Apache Spark 实现高效 ETL
NVIDIA Grace CPU 超级芯片可为数据中心和云端的 CPU 工作负载提供出色的性能和出色的能效。
3 MIN READ

2025年 3月 6日
在 NVIDIA GPU 上无需更改代码即可加速 Apache Spark ML
适用于 Apache Spark 软件插件的 NVIDIA RAPIDS 加速器 开创了零代码更改用户体验 (UX),
2 MIN READ

2025年 1月 29日
使用 GPU 在 Apache Spark 上加速 JSON 处理
JSON 是一种热门的文本数据格式,可实现 Web 应用程序中系统之间的互操作性以及数据管理。这种格式自 21 世纪初就已存在,
3 MIN READ

2024年 6月 14日
通过五门新的 NVIDIA 技术课程提升您的技能
随着人工智能以前所未有的速度引入技术创新,保持领先意味着保持你的技能与时俱进。NVIDIA 开发者计划为您提供所需的工具、培训和资源,
1 MIN READ

2023年 11月 9日
借助 RAPIDS 和 Prometheux Vadalog Parallel 加速神经符号 AI
随着可用数据规模的不断增长,对可扩展的智能数据处理系统的需求也在不断增长,以快速利用有用的知识。尤其是在生命科学和金融等高风险领域,
2 MIN READ

2023年 10月 24日
使用 Spark RAPID ML 库中的新算法降低 Apache Spark ML 计算成本
Spark RAPID ML 是一个开源 Python 包,它可以使 NVIDIA GPU 加速 PySpark MLlib。
3 MIN READ

2023年 9月 6日
GPU 用于 ETL?为 Apache Spark SQL 操作进行 ETL 体系结构优化
使用 GPU 进行提取、转换和加载(ETL)操作的 NVIDIA RAPIDS Accelerator for Apache Spark…
2 MIN READ

2023年 7月 17日
GPU 用于 ETL ?使用 NVIDIA RAPIDS 加速器为 Apache Spark 和 Databricks 运行更快、成本更低的工作负载
我们被卡住了。真的卡住了。随着艰难的交付截止日期的临近,我们的团队需要弄清楚如何在几个小时内处理数万亿销售点交易记录的复杂提取转换负载(…
2 MIN READ

2023年 6月 12日
使用 Spark 3.4 简化分布式深度学习
Apache Spark是一个业界领先的平台,用于大规模数据的分布式提取、转换和加载( ETL )工作负载。随着深度学习( DL )的发展,
2 MIN READ

2023年 6月 2日
GPU 集成为 Taboola 带来数据中心效率和成本节约
当您在网页上看到与上下文相关的广告时,它很可能是由 Taboola 数据管道提供的内容。作为世界领先的内容推荐公司,
5 MIN READ

2023年 4月 18日
新的 GPU 库降低了 Apache Spark ML 的计算成本
Spark MLlib是Apache Spark用于大规模machine learning并且提供了许多流行的机器学习算法的内置实现。
2 MIN READ