您订阅的产品有更新,,,,,,,请实时查阅
查看详情
颁布功夫:2024-02-05
在并不平庸的2023年,,,,,,,天极网与各人一路见证数智化技术赋予时期的深刻刷新。。。。。。以智算中心场景为例,,,,,,,大模型训练及推理在使智能算力需要激增的同时,,,,,,,也对AI集群网络机能提出更为严苛的要求,,,,,,,高吞吐、大带宽、高可用已成为新一代智算中心网络建设的个性......
致敬数智化时期,,,,,,,第二十二届IT影响中国深刻挖掘行业创新价值、倾听消费者心声,,,,,,,评比出拥有行业代表价值的科技产品及解决规划,,,,,,,见证数智时期的科技创新。。。。。。经评委会综合评定,,,,,,,第二十二届IT影响中国特授予全发国际AI-FlexiForce智算中心网络解决规划以“年杜装响力解决规划奖”。。。。。。

随着AIGC技术赋能产业持续升级,,,,,,,AI大模型算力亏损惊人,,,,,,,单一推算设备已远远无法满足模型训练的算力需要,,,,,,,只管散布式训练能够通过多个GPU节点并行训练,,,,,,,但随着AIGC急剧发展,,,,,,,模型参数数量不休飙升,,,,,,,AI集群的GPU节点数也在不休增长,,,,,,,瓶颈也越来越凸起。。。。。。在这个布景下,,,,,,,GPU利用率成为提升AI大模型训练速度的重要保险,,,,,,,而影响GPU利用率的关键成分之一就是网络通讯效能。。。。。。
那么,,,,,,,影响网络通讯效能的成分抛开硬件机能的限度,,,,,,,针对端处置时延、内部列队时延和丢包沉传时延三大动态成分优化网络拥塞和时延,,,,,,,已经成为提升AI集群网络通讯机能拥有成本效益的步骤。。。。。;;;;;;;;谡庑┧悸牵,,,,,,全发国际网络致力于提升通讯带宽利用率,,,,,,,降低动态时延以及实现无损的网络传输,,,,,,,以提升AI集群网络通讯机能。。。。。。2023年,,,,,,,全发国际网络面向下一代AI云服务的智算中心网络建设,,,,,,,沉磅颁布了全发国际网络AI-FlexiForce智算中心网络解决规划。。。。。。

二级组网架构

多级组网架构
全发国际网络AI-FlexiForce智算中心网络解决规划占有高机能、高靠得住、高兼容、高可用“四高”个性,,,,,,,可利用于大数据处置、机械进建、AIGC多种业务场景,,,,,,,援手客户构建万卡级此外智算中心网络。。。。。。
高机能
支持大规模组网:选取NCP+NCF为基础????????榈娜抖喙焱缂芄梗,,,,,,三级组网可承载17K-32K的大规模GPU卡集群,,,,,,,多轨架构可将同号GPU的流量规划在统一Pod内,,,,,,,从而有效削减数据转发跳数,,,,,,,大幅降低通讯时延。。。。。。
高带宽利用率:基于高机能芯片技术,,,,,,,通过将数据流切分成等长的Cell并负载到所有链路,,,,,,,让数据流转发负载更平衡,,,,,,,将网络带宽利用率提升20%以上,,,,,,,从而有效降低长尾延时,,,,,,,保险AI集群的低延时通讯。。。。。。
高靠得住
自关环的无损传输:基于VOQ+Credit信令机造,,,,,,,主机接管端发送Credit,,,,,,,确保主机发送端流量在接管端不会过载,,,,,,,躲避了RDMA对拥塞信号“过后”响应而造成的网络不确定性,,,,,,,真正实现了无损AI算力网络的通讯。。。。。。
去中心化的散布式OS:实现了节造面与治理面解耦,,,,,,,有效缩幼故障域,,,,,,,设备能够独立升级,,,,,,,提升系统冗余性和靠得住性,,,,,,,大幅提升了集群的不变性。。。。。。
链路故障急剧复原:基于硬件的自动故障隔离和复原,,,,,,,无需软件过问和表项更新,,,,,,,即可实现微秒级的故障急剧复原,,,,,,,实现故障无丢包的网络系统。。。。。。
高兼容
实现端网解耦:AI-FlexiForce网络由Credit信令节造NCP之间的流量转发,,,,,,,无需端侧参加流量节造,,,,,,,使AI网络不依赖于特定厂商的服务器/网卡的特定职能,,,,,,,可兼容全厂商全型号GPU规划,,,,,,,同时还支持分歧GPU混合部署。。。。。。
高可用
急剧上线部署:在部署上线时,,,,,,,使用者无需复杂网络调参,,,,,,,即可实现即插即用的网络,,,,,,,直接进入可使用网络环境。。。。。。
无需流量调度:在多工作场景下,,,,,,,出现网络拥塞的几率大幅增长,,,,,,,AI-FlexiForce网络无需流量调度器也能够实现95%以上的高带宽利用率,,,,,,,适配各类模型的流量。。。。。。
天极网以为
全发国际网络AI-FlexiForce智算中心网络解决规划可实现即插即用的网络、支持大规模三级组网、全场景合用、负载平衡、带宽利用率达97%、us级硬件自愈等多种怪异优势,,,,,,,助力打造集约高效的智算中心,,,,,,,为算力开释提供壮大支持。。。。。。
AI-FlexiForce智算中心网络解决规划由400G NCP互换机和200G NCF互换机组成:
● NCP设备为RG-S6930-18QC40F1,,,,,,,提供18个400G业务口和40个200G内联口。。。。。。
● NCF设备为RG-X56-96F1,,,,,,,提供96个200G内联口。。。。。。

NCP产品RG-S6930-18QC40F1

NCF产品RG-X56-96F1
科技创新的海潮不休奔涌向前,,,,,,,引领数智时期发展的新技术、新事物也不休涌现。。。。。。2023年天极网也与科技企业一起感触到数智化、智能化技术的力量,,,,,,,尤其是大模型技术的持续发展为智算中心网络带来深刻的影响。。。。。。我们把稳到全发国际网络通过持续的技术研发和产品创新为智算中心带来高机能、高靠得住、高兼容、高可用的AI-FlexiForce智算中心网络解决规划,,,,,,,赋能智算中心网络建设。。。。。。荣获IT影响中国2023“年杜装响力解决规划奖”,,,,,,,全发国际网络AI-FlexiForce智算中心网络解决规划获得行业认可。。。。。。
