虽然世界在不断变化,但开发人员仍在不断推动他们使用创新技术应对挑战。最近的台湾计算云( TWCC ) GPU Hackathon 就是这样一个例子,它是开发者和工程师使用 GPU 推进 HPC 和 AI 项目的催化剂。
国家高性能计算中心 、 台湾网络服务公司 、 NVIDIA 和 OpenACC 、 12 个团队和 15 名 NVIDIA 导师之间的合作,使用了从人工智能驱动的制造调度模型到快速洪水预测模型的各种方法来加速项目。
利用人工智能优化生产效率
智能制造的关键领域之一是优化和自动化生产线流程。团队 AI 调度员和 工业技术研究中心(工研院) 的 计算智能技术中心( CITC ) 成员来到 hackathon ,使用机器学习开发他们的制造调度模型。
传统的调度模型大多采用启发式规则,能够即时响应动态事件。然而,他们的短期方法通常不会带来最佳解决方案,并且在处理变化的变量时被证明是不灵活的,这限制了他们的持续生存能力。
该团队的方法使用蒙特卡罗树搜索( MCTS )方法,将经典的树搜索实现与强化学习的机器学习原理结合起来。该方法解决了现有的启发式限制,提高了整体调度模型的效率,提高了效率。
通过与导师合作,团队 AI Scheduler 学会了使用 NVIDIA Nsight 系统 来识别瓶颈,并使用 GPU 来并行化代码。活动结束时,团队能够加快 MCTS 算法的模拟步骤。这将调度时间从 6 小时减少到 30 分钟,并使总体调度效率提高了 11.3 倍。
工研院 CITC 的曾正苏博士和黄浩哲博士说:“在本次黑客大会上证明了使用 GPU 加速我们的模型的可行性之后,下一步是将其应用到我们的商业模型中,供工业使用。”。
使用 GPU 了解地球科学的全局
台湾位于欧亚大陆和菲律宾海板块之间,是世界上构造最活跃的地区之一,也是全球地震研究的重要基地。地质研究和构造活动的时间尺度通常以数千年或数万年为单位。这需要使用大量数据和足够的计算能力来进行有效分析。
由 中央研究院地球研究所 的谭博士领导的 IES 地球动力学团队来到 GPU Hackathon 加速他们的数值地球动力学模型。它名为 DynEarthSol ,模拟地幔对流、俯冲、造山和构造。此前,该团队通过将数据分块并限制计算过程以适应 CPU 有限的计算能力来减少计算和步骤的数量,从而处理大量数据。这使得很难看到研究的全貌。
在黑客竞赛的过程中,团队使用了一种新的数据输入方法,利用 GPU 计算数据和多个步骤。使用 OpenACC , IES 地球动力学团队能够将 80% 的模型移植到 GPU ,并实现了 13.6 倍的加速。
“这是我第二次参加 GPU 黑客竞赛,我肯定会参加下一次,”中央研究院国际研究所研究员谭恩恩教授说。“我们已经学会了采用 GPU 的适当方法,用户友好的分析工具为我们提供了一个优化模型的好主意。”
该团队将继续致力于移植其模型的剩余 20% 。他们期待使用 GPU 运行更多高分辨率模型,以更深入地了解台湾的编队活动。
用于应急规划和响应的快速洪水评估
洪水是最具破坏性的自然灾害之一。每年造成大量人员伤亡和经济损失, 全世界平均有 2100 万人受洪水影响 ,由于气候变化和其他因素,预计人数还会增加。预防和减轻这些危害是一项关键工作。
来自 国立杨桥大学( NYCU ) 的 THINKLAB 团队正在开发一种模型,该模型可以为紧急情况提供快速准确的结果,同时保持操作的简单性。所提出的 混合淹没模型( HIM ) 通过元胞自动机方法求解零惯性方程,并与亚网格级插值策略配合使用,以生成更高分辨率的结果。
使用 Python 和 NumPy 库开发的 HIM 模型在 hackathon 开始时没有并行或 GPU 计算。在活动期间, THINKLAB 团队使用 CuPy 为了使他们的代码在 GPU 上并行运行,然后重点将用户定义的 CUDA 内核应用于参数。结果是 672 倍加速,计算时间从 2 周缩短到大约 30 分钟。
THINKLAB 团队成员 Obaja Wijaya 说:“我们在这次活动中学到了很多技巧,并向其他人强烈推荐这些活动。”。“NVIDIA 是这一领域的专家,通过与他们的导师合作,我们学会了如何使用 GPU 编程优化模型/代码。”
2022 年期间还将安排额外的黑客竞技场和新兵训练营。有关 GPU 黑客大会和未来活动的更多信息,请访问 https://www.gpuhackathons.org .