专刊介绍
高性能计算(High-PerformanceComputing,HPC)进入艾级计算的时代,并行编程系统和运行时支撑技术(包含操作系统)面临巨大的挑战。挑战一方面来自底层计算机体系结构的急剧变革,硬件并行层次的逐渐加深、节点内的处理器异构、以及结构各异的各种领域硬件加速器的广泛采用,硬件结构的复杂性带来了用户编程和程序优化的挑战。挑战另一方面来自蓬勃兴起的新应用,大数据处理和机器学习应用对性能有强烈的需求。如何在现代的HPC系统上提高这些应用的性能成为产业界和学术界的研究热点。
围绕“编程系统与运行时支撑技术”主题,本专刊精选8篇受邀论文,展示编程系统、运行时和操作系统技术相关领域最新的研究进展,以期对研究人员有一定的启发。
专刊包括3部分内容:
第一部分与并行编程和编译系统的研究相关,有四篇论文。大量遗产的MPI应用面临如何在大规模异构并行的超级计算机上高效运行的问题。LiChen等人撰写的论文提出了一种数据驱动的任务并行编程接口AceMesh,能把传统MPI程序自动、安全地迁移到大规模异构并行的计算机上。论文介绍了所提出语言机制的动机和效果,介绍了相关的编译和运行时技术,并用实际应用展示了其性能优势。由LiboZhang等人撰写的论文为OpenACC编译器提出一种动、静态结合的循环和数据的自动映射技术,该技术可显著降低用户的编程负担,在国产异构并行平台的测试表明该自动技术的性能十分接近手工制导版。在深度学习领域,各种硬件加速器成为提升性能的关键,但编译工具链面临着高效代码生成和优化的巨大挑战。ZihanLiu等人的论文介绍了寒武纪推理加速器的一个编译工具链Paleozoic的设计,所提出的新编程接口可大幅度降低了用户代码行数并能暴露绝大部分的优化旋钮,与现有接口的对比验证了该工具链的有效性。深度神经网络的分布式训练是一个计算密集、且通信密集的过程,如何提高此类框架的性能和并行扩展性是一个重要的研究课题。GuoFengLv等人的论文在国产神威·太湖之光超级计算机上,探讨了多种分布式训练算法和不同的通信策略,并在一个医学图像分析的案例中验证了其扩展性。
专刊的第二部分是两篇关于运行时支撑技术的论文。云计算环境下大规模图数据处理的计算需求呼唤新的硬件加速技术,数据流体系结构受到学术界的特别