400-0698-860

新闻中心

洞悉超擎数智品牌力与产业变革

超以太网联盟(UEC)成立,将与InfiniBand在AI和HPC领域同台竞争

时间:2023-08-02
来源:本站编辑
阅读量:1102
分享:

近期,超以太网联盟 (Ultra Ethernet Consortium,UEC) 正式成立,它是一个由 Linux 基金会及其联合开发基金会倡议主办的新组织。UEC 的目标是超越现有的以太网功能,例如远程直接内存访问 ( RDMA ) 和融合以太网 RDMA (RoCE),提供针对高性能计算和人工智能进行优化的高性能、分布式和无损传输层,直接将矛头对准竞争对手的传输协议 InfiniBand。

 

UEC 与当前以太网有何不同?

 

人工智能 (AI) 和高性能计算 (HPC) 工作负载的快速发展给网络带来了新的挑战,比如需要更大规模、更高带宽密度、多路径、对拥塞的快速反应以及对单个数据流执行度的相互依赖(其中尾延迟是关键考量点)。UEC 规范的设计将弥补这些差距,并为这些工作任务提供所需的更大规模组网。超以太网解决方案堆栈将利用以太网的普遍性和灵活性来处理各种工作负载,同时具有可扩展性和成本效益。超以太网并不是要彻底改革以太网,而是调整以太网以提高具有特定性能要求的工作负载的效率——从物理层一直到软件层——以找到大规模提高效率和性能的最佳方法。

 

UEC 传输协议

 

为改进以太网,UEC 联盟提出了UEC 传输协议。UEC 传输正在开发中,旨在提供比目前的 RDMA 更好的以太网传输(仍支持 RDMA),在提供AI和HPC应用程序所需性能的同时保留以太网/IP的优势。

 

UEC 传输是一种靠近传输层的新形式,它有一些语义调整、拥塞通知协议,并且增强了安全功能。UEC将提供更灵活的传输,不需要无损网络,允许many-to-many人工智能工作负载所需的多路径和无序数据包传输等功能。

 

UEC传输协议:

从一开始就设计为在IP和以太网上运行的开放协议规范。

多路径、包喷洒传输,充分利用AI网络,不会造成拥塞或队头阻塞,无需集中式负载均衡算法和路由控制器。

Incast管理机制,以最小的丢包控制到目标主机的最终链接上的扇入。

高效的速率控制算法,允许传输快速提升至线速,同时不会导致竞争流的性能损失。

用于无序数据包传送的 API,可选择按顺序完成消息,最大限度地提高网络和应用程序的并发性,并最大限度地减少消息延迟。

可扩展未来网络,支持1,000,000个端点。

性能和最佳网络利用率,无需针对网络和工作负载进行特定的拥塞算法参数调优。

旨在商用硬件上实现 800G、1.6T 和未来更快以太网的线速性能。

 

有分析指出,超以太网联盟(UEC)的成立,意味着将与InfiniBand在AI和HPC领域同台竞争。

 

InfiniBand 连接技术已在超算中盛行

 

InfiniBand 已成为超级计算机最流行的内部连接技术。2022 年 7 月 ,IBTA宣布,在同年6月公布的全球超算TOP500中,197个系统部署了InfiniBand,同比增长 17%。InfiniBand还连接了Top100中的62个,使其成为世界顶级超级计算机中使用最多的高速互连。

 

InfiniBand 在 TOP500 中的突出表现表明,它有能力提供世界顶级系统所需的速度、低延迟和可扩展性。利用 InfiniBand 和融合以太网 RDMA (RoCE) 等远程直接内存访问 (RDMA) 结构还可以为数据中心提供可靠性、效率以及高度互操作性的环境,以便这些系统进行扩展。

 

 

UEC 的未来之路

 

展望未来,人工智能和高性能计算的工作负载和网络需求预计将越来越多地重叠。考虑到对带宽和延迟的不同敏感性,UEC规范将提供两种配置文件:一种针对AI优化,另一种针对HPC优化。


 
UEC 技术咨询委员会主席 Uri Elzur 表示,通过插件测试和合规性测试确保互操作性将是未来的重点。UEC 的目标是确保其开放性和可互操作性。