mg冰球突破

云领将来 智启新篇 丨 mg冰球突破网络"全校一朵云"线上钻研会
date
预约直播
铸数基 · 智运维 丨 mg冰球突破乐享3.0智能运维解决规划颁布会
date
预约直播
mg冰球突破(中国区)官方网站
产品
< 返回主菜单
产品中心
产品
解决规划
< 返回主菜单
解决规划中心
行业
合作同伴
返回主菜单
选择区域/说话
mg冰球突破(中国区)官方网站

您订阅的产品有更新,请实时查阅

查看详情

IT168 | AIGC海潮之下,mg冰球突破若何为算力网络注入“智能”

mg冰球突破(中国区)官方网站 颁布功夫:2024-07-10
mg冰球突破(中国区)官方网站

当前,AI技术在持续赋能产业刷新 。继文本和图像之后,Sora的出现让AI海潮席卷至视频领域,推动AI多模态领域的急剧发展 。以AIGC为代表的业务利用在沉塑人类的进建蹊径、工作模式甚至生涯节拍,推动智能化和便捷化的发展 。

AIGC时期,大模型参数量持续飙升,算力需要也随之增长,这就要求网络可能承载更大规模的GPU集群 。以GPT-4为例,其参数量已跃升至惊人的1.8万亿,训练所需的算力更是高达4680P,只有万卡集群可能提供足够的算力支持,满足大模型训练的需要 。

由于GPT-4扩大MoE引入了大量的All to All通讯,使机内和机间通讯的比例险些达到了1:1,机间All to All通讯是依附互换机转发进行传输,因而网络通讯对GPU利用率的影响越发显著 。这意味着,互换机必要升级到800G和1.6T的规格,以满足大模型训练过程中的超大带宽需要 。

此表,在构建大规模训练集群时,往往建设罕见以万计的高机能GPU,旨在支持并行处置多个复杂的模型训练工作 。这种多工作并行环境极大地增长了流量的复杂性和动态性,对网络系统的负载平衡能力提出了前所未有的挑战 。因而,网络架构必要具备肯定的矫捷性和可扩大性,以应对不休变动的流量需要 。

 

mg冰球突破AIGC智算中心网络 支持大规模算力集群建设

面向下一代AI云服务的智算中心网络建设,mg冰球突破网络在去年推出了AI-Fabric智算中心网络解决规划AI-FlexiForce智算中心网络解决规划,以其高吞吐、大带宽、高可用的个性,可利用于大数据处置、机械进建、AIGC多种业务场景,助力客户构建万卡级此外智算中心网络,支持AI业务急剧发展 。

mg冰球突破网络AI-FlexiForce智算中心网络解决规划选取NCP+NCF为基础 ?楹嵯蚶┐蟮娜锻缂芄,并基于高机能芯片技术,通过将数据流切分成等长的Cell并负载到所有链路,提升网络带宽利用率;基于VOQ+Credit的端到端流控机造实现与业务无关的无损自关环网络,助力业务算力提升 。

AI-FlexiForce规划通过利用链路负载和拥塞节造技术,底子性解决网络中的拥塞矛盾问题,提升GPU之间通讯和推算效能,加快企业大模型利用的推出 。同时,mg冰球突破网络打造了散布式OS,意在实现散布式规划架构的统一治理基础上,最大水平降低系统性风险,提升AI训练网络的持久不变运行 。

 

mg冰球突破(中国区)官方网站 

▲mg冰球突破网络数据中心网络事业群高级技术总监 权熙哲

 

为了适应客户的普适性场景,mg冰球突破网络在今年创新性地推出了AILB负载平衡解决规划,并从1.0版本持续迭代升级至2.0版本 。凭借其靠得住的机能与矫捷性,AILB规划实现了多工作环境下分歧模型间的数据通讯 。权熙哲指出,“借助AILB规划,客户能够更好地实现端到端的链路选择,实现端到端的高吞吐 。”

基于GPU间有法规的传输流量特点及Leaf/Spine之间1:1收敛的特点,网络设备以Leaf分组,为Leaf接入地所有网卡,自动预规划全局负载平衡蹊径;主路由与其它等价蹊径形成1主多备,AILB规划的快切技术,实现10ms内实现蹊径切换 。

据悉,AILB规划能够叠加单级PFC(预防“多打一”)构建无损Fabric,无需ECN端网对接,实现GPU网卡与表部网络解耦 。AILB规划在16节点PerfTest测试中,带宽利用率高达97.6%,其急剧的Failover切换功夫,保险训练业务的陆续性 。该规划支持智算中心多租户部署模式,合用于非Mellanox系列网卡 。

目前,mg冰球突破网络智算中心网络解决规划为跨行业通用型,不特定于某个单一行业,而是宽泛合用于AI大模型公司、当局行业、电力能源行业(如光伏企业)、IDC公司等等,为客户提供越发专业的技术服务,助力他们应对市场挑战,实现可持续发展 。

 

400G互换机与LPO光 ?榫蘖料郙WC2024

在MWC2024展区,mg冰球突破网络展出了RG-S6990-128QC数据中心互换机,以及高密度、低功耗的400G/800G LPO自研光 ?,合用于数据中心、高机能推算网络、企业主题散布层,为数据中心服务器和互换机提供经济高效的高速互联 。

 

400G/800G LPO光? 
▲400G/800G LPO光 ?

 

RG-S6990-128QC互换机是mg冰球突破网络面向高端数据中心和AIGC智算场景推出的新一代高机能、高密度盒式互换机 。它选取先进的硬件架构设计,提供128个400GE端口,所有端口均支持线速转发,转发机能达到51.2Tbps,支持冗余可插拔电源和电扇,支持AI-Fabric规划RALB和AILB负载平衡技术,提升AIGC智算场景下贱量带宽,缩短AI训练时长 。

权熙哲指出,“以51.2T芯片为基础,这款互换机可能提供128个400GE端口,支持高达1000张GPU卡的通讯规模 。同时,高密度的接口设计使得单个互换机可能衔接更多服务器,支持更大规模的服务器集群,满足将来不休增长的数据处置需要 。”

400G-QDD-DR4-SM1310 ?樯杓朴糜400G光 ?,选取QSFP-DD封装,MPO-12 APC接头接口,使用波长1310nm,需配套单模光纤使用,最大传输距离为500m,能够实现功耗降低50%,LPO时延降落90%,成本降低15%,无需1分2跳线,规模增长一倍,仍可维持传统布线规划 。

在成本方面,随着400G LPO光 ?榈腄SP芯片量产,其成本占比已从早期的30%以上降至当前的10%左右,提升了产品的性价比 。对于更高速度的800G及1.6T光 ?,mg冰球突破虽面对DSP芯片成本占比力高的挑战,但仍致力于通过技术创新与规模效应来降低成本 。

权熙哲以为,“我们已正式颁布了400G与800G的LPO光 ?,实现了整体功耗降低超过60%的功效 。具体而言,传统光 ?榭赡芸魉鸶叽15瓦的电力,而mg冰球突破LPO光 ?榻鲂4~5瓦,极大提升了能效比 。但愿通过mg冰球突破的互换机加线性光 ?,给客户提供一个有竞争力的性价比 。”

下半年,mg冰球突破网络将推出800G及更高密度的互换机产品,同时,1.6T互换机及配套的线性光 ?橐苍诮袈嗝芄牡难蟹⒅,预计在将来两年内面世 。我们相信,通过不懈致力,mg冰球突破可能克服技术挑战,推动光通讯领域向更高速度、更低功耗、更低成本的方向发展 。

 

转载起源:IT168

关注mg冰球突破
gfwx_logo
关注mg冰球突破官网微信
随时相识公司最新动态
mg冰球突破(中国区)官方网站

返回顶部

收起
mg冰球突破(中国区)官方网站 文档AI副手
mg冰球突破(中国区)官方网站 文档评价
ev-close ev-close-m
该资料是否解决了您的问题 ?
ev-close ev-close-m
您对当前页面的中意度若何 ?
不咋滴
极度好
dark-star dark-star dark-star dark-star dark-star
ev-close ev-close-m
您中意的原因是(多 。 ?
您对文档是否还有其它的问题或建议 ?
为尽快解决问题,请您留下联系方式以便回复
邮箱
手机号
ev-bg
感激您的反 。
mg冰球突破(中国区)官方网站
mg冰球突破(中国区)官方网站
mg冰球突破(中国区)官方网站
请选择服务项目
关关征询页
售前征询 售前征询
售前征询
售后服务 售后服务
售后服务
定见反馈 定见反馈
定见反馈
更多联系方式
【网站地图】