解决国内ChatGPT类大模型算力不足问题
1、传统TCP协议面对100G以上的高速高可靠网络通信环境,已经力不从心,RDMA成为该场景下的主力协议趋势明显
2、ChatGTP的大规模训练模型所需的硬件环境,国内单一企业和云算力中心很难承担,亟需长途高速多云互联协同训练,具备长途容损能力的RDMA协议类网络产品价值突显
3、基于硬件打造的100G高速RDMA网络,为是科技发布的VX-S100打破了英伟达一枝独秀的局面。其容损和长距离大容量传输功能,更是弥补了英伟达相关产品的功能缺陷,初步满足各地算力网络互联协同的需求
近日,为是科技成功通过中国移动研究院“数据快递”类业务的长途远距高速数据传送测试。于此同时,为是科技正式发布自己的第一代基于FPGA打造的smartNIC产品VX-S100。该产品是移动研究“数据快递”业务测试环境中的核心部件,它突破了传统RDMA网卡组网距离短(2公里以内)、需要更换原有网络交换机(支持特殊的网络协议)等缺陷,在现有的网络环境下,只更换网卡,即可完成RDMA端到端对TCP协议的替换,同时在有损网络环境下,使RDMA的传输速率保持在几乎满载的状态。
中国移动的相关技术人员表示,该技术不止对超大规模的长途数据搬用具有及其重要的价值,同时在当今热炒的ChatGPT的数字基座建设上,也会发挥巨大价值和现实意义。
众所周知,微软的ChatGPT训练硬件自建和行业资源整合,换算成总资金投入,已经超过1000亿美元。这让全世界任何一个国家在追赶其步伐的道路上都感到力不从心,投入过高。而中国的算力中心,总算力虽然可以局部媲美微软,可是目前还缺少技术能将如此多的GPU算力连接为一体,而为是科技的VX-S100恰逢其时的解决了这一世界级难题。VX-S100已被中科院紫金山实验室实测验证支持5000公里以上的数据节点高速互联,100G带宽有效利用率高达90%以上,是传统TCP传送效率的近50倍,是现有RDMA长距传输能力的88倍。
而且,强大的容损能力,更让中国的数字网络无需更换现有大部分的核心交换节点,就能从TCP时代升级进入高速的RDMA时代,其实用性和可靠性,都对加速我国各GPU算力中心能力整合提供了强大的支持,从而将GPU算力真正实现网络化、云化,为中国在ChatGPT类人工智能的算力底座搭建模式上,提供了一种全新的思路和可能,意义不可谓不重大。
于此同时,为是科技后续还将提供V-RDMA类、Vsocket类等系列产品,其核心理念就是在最小改动现有网络的条件下,用容损RDMA协议逐步低成本的替换传统TCP协议,从而实现算力网络协议的平滑演进。
VX-S100的正式发布,预示着江苏为是科技有限公司,已经吹响了新一轮算力网络协议升级换代的号角,相信随着更多更有竞争力的产品面世,必将带动整个行业进入新的网络纪元。