.

来自星云Clustar干货分享APN

北京白癜风的费用 http://baidianfeng.39.net/
年12月15日,APNetChinaForum中国网络研究论坛在北京香山会议中心召开。此次研讨会由APNet主办,CCF互联网专委会、CCF网络与数据通信专委会、ACMSIGCOMMChina共同协办。论坛邀请了字节跳动、阿里巴巴、百度、华为、Mellanox等知名公司的行业大牛,以及香港科技大学、清华大学、国防科技大学等专家学者,围绕着RDMA和NetML两个主题为大家带来了一场视听盛宴。星云Clustar作为RDMA技术与NetML技术的探索者,也参与了这一盛会。RDMA技术会议纪要首位分享嘉宾是来自字节跳动高等科学家朱亦博博士,他演讲的主题为《AcceleratingCloudApplicationswithRDMANetwork》。演讲主要围绕如何利用RoCEv2技术来加速数据中心应用。演讲从科研内容开始聊起,讲到RDMA的另一个面貌:通过网卡绕开CPU,直接操作内存,完成复杂计算,这使得设计分布式系统有了崭新的思路。演讲中提到两个应用。第一个应用是HyperLoop,用于解决分布式存储系统在多租户场景下,CPU调度引发的不可预测的高延迟问题。HyperLoop的关键技术点在于利用RDMA+NVM、RDMA的可编程性,重新设计的API增加易用性。HyperLoop利用了RDMAWait这一原语,并Pre-post一些操作,使得不通过CPU来控制网卡何时进行何种操作成为可能。更进一步,HyperLoop可以通过某张RDMA网卡编程下一张RDMA网卡来实现更复杂的操作。最后,HyperLoop封装了这一系列的复杂操作,使得上层应用可以简单地使用HyperLoop。星云Clustar认为采用RDMA来消除关键路径上CPU的参与,是未来分布式系统设计的一个重要思路。星云Clustar研发的星云平台中,同样采用了基于RDMARoCEv2的高性能网络来提升应用的端到端性能。第二个应用是GEM,利用RDMA技术来辅助可编程交换机。GEM首先提出了可编程交换机的一个重要问题是内存太小,并通过RDMA技术将数据中心服务器上的闲置内存、空闲带宽交给可编程交换机来利用,极大的扩展了可编程交换机的可用内存。星云Clustar认为,RDMA技术使得ResourceDisaggregation成为可能,极大的扩充了数据中心新架构的想象空间。第二位分享的嘉宾是来自Mellanox的AI首席架构师宋庆春,他演讲的主题为《BuildingOptimizedRDMANetworks》。其演讲内容基于Vendor的角度来看RDMA的研究工作。他提到了RDMA在本质上的难点,首先是如何将传输层上的操作全部放到硬件上去做,彻底消除CPU的参与;其次是如何在硬件层面上保证应用与应用之间传输的数据完整性。在演讲中,他也介绍了Infiniband和RoCE这两种RDMA实现手段的区别与各自的优势。Infiniband通过子网管理器能够支持超大规模网络,并解决网络内拥塞等复杂问题;而RoCE在兼容现有硬件、协议等方面有巨大优势。他也提到了RoCE的无损网络主要通过PFC来实现,在交换机入口buffer快满的时候暂停(pause)上游交换机的数据发送;同时ECN也可以起到很好的控制作用。星云Clustar在RoCE无损网络的配置、优化上积累了大量学术界、工业界的经验,通过优化PFC、ECN配置使得无损网络的性能得到极大的提升,并可以防止网络死锁。演讲中还提到了RDMA的几个使用场景,比如科学计算,机器学习以及大数据计算。在机器学习过程中,RDMA的一个重要应用是在机器学习训练过程中进行加速,数据并行、模型并行等场景中进行使用。最后,宋庆春介绍了GPUDirect技术,GPUDirect4.0能够使得GPU可以直接控制数据传输,减少CPU的参与。星云Clustar也将拥抱最先进的GPUDirect技术,将其应用到机器学习框架及应用中去,提升算力到生产力的转换。第三位分享嘉宾是来自国防科技大学的董德尊教授,他演讲的主题为《TowardFull-StackSimulationofMPICommunicationoverRDMA-enabledTianheInterconnectionNetworks》。演讲围绕着RDMA在天河2号超算中的使用场景进行分享。董德尊教授介绍了天河2号的网络互联架构,天河2号拥有非常低的MPI端到端延迟,最低可达1.2us,最高仅有~5us。董德尊教授的主攻方向是高性能计算(HPC)仿真器的设计,协同设计理念在HPC中十分重要,但是,现在计算、网络、应用仿真系统相对独立,从而使得仿真结果不够精确。董德尊教授提出,仿真器应协同考虑应用、计算、网络几个因素。在调研完几个现有的仿真系统之后,他提出了一个理想的仿真器应该同时具有在线、离线功能,并且网络仿真精确,覆盖链路层以上的功能,并且可以重现CPU的计算行为以及Collective操作的行为。因此,从年开始,天河互联系统建模项目开始,旨在实现网络的全栈模拟,规模可以达到-0,并使得trace模式下达到0-000的规模。该项目的功能模块主要包括高性能应用负载,仿真支撑平台,网络功能模型等。星云Clustar认为,高性能计算(HPC)领域的很多技术都比较先进,但很多硬件都为专用制造。我们的一个重要目标即为将该领域的先进技术转换到商用场景中,造福各类需要高性能计算的企业。下半场的NetML干货分享在稍后的另外一篇呈现,敬请


转载请注明:http://www.abachildren.com/xgyy/9946.html

  • 上一篇文章:
  • 下一篇文章: 没有了