您当前位置：编程技术 >> 编程技术历史

来自星云Clustar干货分享APN

北京白癜风的费用 http://baidianfeng.39.net/
年12月15日，APNetChinaForum中国网络研究论坛在北京香山会议中心召开。此次研讨会由APNet主办，CCF互联网专委会、CCF网络与数据通信专委会、ACMSIGCOMMChina共同协办。论坛邀请了字节跳动、阿里巴巴、百度、华为、Mellanox等知名公司的行业大牛，以及香港科技大学、清华大学、国防科技大学等专家学者，围绕着RDMA和NetML两个主题为大家带来了一场视听盛宴。星云Clustar作为RDMA技术与NetML技术的探索者，也参与了这一盛会。RDMA技术会议纪要首位分享嘉宾是来自字节跳动高等科学家朱亦博博士，他演讲的主题为《AcceleratingCloudApplicationswithRDMANetwork》。演讲主要围绕如何利用RoCEv2技术来加速数据中心应用。演讲从科研内容开始聊起，讲到RDMA的另一个面貌：通过网卡绕开CPU，直接操作内存，完成复杂计算，这使得设计分布式系统有了崭新的思路。演讲中提到两个应用。第一个应用是HyperLoop，用于解决分布式存储系统在多租户场景下，CPU调度引发的不可预测的高延迟问题。HyperLoop的关键技术点在于利用RDMA+NVM、RDMA的可编程性，重新设计的API增加易用性。HyperLoop利用了RDMAWait这一原语，并Pre-post一些操作，使得不通过CPU来控制网卡何时进行何种操作成为可能。更进一步，HyperLoop可以通过某张RDMA网卡编程下一张RDMA网卡来实现更复杂的操作。最后，HyperLoop封装了这一系列的复杂操作，使得上层应用可以简单地使用HyperLoop。星云Clustar认为采用RDMA来消除关键路径上CPU的参与，是未来分布式系统设计的一个重要思路。星云Clustar研发的星云平台中，同样采用了基于RDMARoCEv2的高性能网络来提升应用的端到端性能。第二个应用是GEM，利用RDMA技术来辅助可编程交换机。GEM首先提出了可编程交换机的一个重要问题是内存太小，并通过RDMA技术将数据中心服务器上的闲置内存、空闲带宽交给可编程交换机来利用，极大的扩展了可编程交换机的可用内存。星云Clustar认为，RDMA技术使得ResourceDisaggregation成为可能，极大的扩充了数据中心新架构的想象空间。第二位分享的嘉宾是来自Mellanox的AI首席架构师宋庆春，他演讲的主题为《BuildingOptimizedRDMANetworks》。其演讲内容基于Vendor的角度来看RDMA的研究工作。他提到了RDMA在本质上的难点，首先是如何将传输层上的操作全部放到硬件上去做，彻底消除CPU的参与；其次是如何在硬件层面上保证应用与应用之间传输的数据完整性。在演讲中，他也介绍了Infiniband和RoCE这两种RDMA实现手段的区别与各自的优势。Infiniband通过子网管理器能够支持超大规模网络，并解决网络内拥塞等复杂问题；而RoCE在兼容现有硬件、协议等方面有巨大优势。他也提到了RoCE的无损网络主要通过PFC来实现，在交换机入口buffer快满的时候暂停（pause）上游交换机的数据发送；同时ECN也可以起到很好的控制作用。星云Clustar在RoCE无损网络的配置、优化上积累了大量学术界、工业界的经验，通过优化PFC、ECN配置使得无损网络的性能得到极大的提升，并可以防止网络死锁。演讲中还提到了RDMA的几个使用场景，比如科学计算，机器学习以及大数据计算。在机器学习过程中，RDMA的一个重要应用是在机器学习训练过程中进行加速，数据并行、模型并行等场景中进行使用。最后，宋庆春介绍了GPUDirect技术，GPUDirect4.0能够使得GPU可以直接控制数据传输，减少CPU的参与。星云Clustar也将拥抱最先进的GPUDirect技术，将其应用到机器学习框架及应用中去，提升算力到生产力的转换。第三位分享嘉宾是来自国防科技大学的董德尊教授，他演讲的主题为《TowardFull-StackSimulationofMPICommunicationoverRDMA-enabledTianheInterconnectionNetworks》。演讲围绕着RDMA在天河2号超算中的使用场景进行分享。董德尊教授介绍了天河2号的网络互联架构，天河2号拥有非常低的MPI端到端延迟，最低可达1.2us，最高仅有~5us。董德尊教授的主攻方向是高性能计算（HPC）仿真器的设计，协同设计理念在HPC中十分重要，但是，现在计算、网络、应用仿真系统相对独立，从而使得仿真结果不够精确。董德尊教授提出，仿真器应协同考虑应用、计算、网络几个因素。在调研完几个现有的仿真系统之后，他提出了一个理想的仿真器应该同时具有在线、离线功能，并且网络仿真精确，覆盖链路层以上的功能，并且可以重现CPU的计算行为以及Collective操作的行为。因此，从年开始，天河互联系统建模项目开始，旨在实现网络的全栈模拟，规模可以达到-0，并使得trace模式下达到0-000的规模。该项目的功能模块主要包括高性能应用负载，仿真支撑平台，网络功能模型等。星云Clustar认为，高性能计算（HPC）领域的很多技术都比较先进，但很多硬件都为专用制造。我们的一个重要目标即为将该领域的先进技术转换到商用场景中，造福各类需要高性能计算的企业。下半场的NetML干货分享在稍后的另外一篇呈现，敬请

转载请注明：http://www.abachildren.com/xgyy/9946.html

上一篇文章：不能编程烧钱没用潘建伟直播回应九章

下一篇文章：没有了