(资料图片)
8月18日,中国算力大会在银川举行。会上,联想召开了引领“智算无限、全栈智能”为主题的新品发布会,推出两款AI服务器新品:联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。
这两款基于AI导向的服务器旨在帮助构建更为高效且环保的人工智能数据中心,满足从模型训练到实际应用的多种算力需求。这一发布标志着联想在支持中国数字化转型、满足日益增长的智能计算需求方面迈出了坚实的步伐。
近些年,随着“数字中国”战略的深入实施,国内算力基础设施迅速发展,推动行业走向更加智能化。IDC报告也指出,随着各行业对AI应用的日益依赖,对智算的需求已超过通用算力,使AI算力成为当前及未来的主流。
此次发布的联想问天WA7780 G3是为大型AI模型训练定制的,性能强劲、灵活高效;基于第四代英特尔®至强®可扩展处理器。NVIDIA HGX H800系统配备8颗H800 NVLink® GPU,拥有高达640GB的HBM3高速显存,通过NVLINK®, GPU间互联带宽高达400GB/s。将AI算力提升了3.44倍,至高可达32P FLOPS AI算力。NVIDIA H800 GPU匹配第四代Tensor Core配合Transformer引擎(FP8精度),与上一代产品相比,可为大模型AI训练速度带来高达9倍提升,可将大模型AI推理速度提升高达30倍。
网络方面也支持IB、RoCE等多种对外网络连接方案。最高可以支持8张RDMA高速网卡,提供3.2Tb/s聚合带宽。充分满足了超大模型训练并行计算时,跨节点的通信需求。同时,在本地存储的设计上,采用了GPU Direct Storage (GDS) 技术。通过GDS技术,GPU与NVMe实现了快速低延迟互联,能够有效提高训练数据载入的速度,提升大模型训练的性能。
而联想问天WA5480 G3,则是一款具备多元化算力的4U机架式AI服务器,非常适合处理从机器视觉到复杂AI模型的多种应用场景。采用2颗第四代英特尔®至强®可扩展处理器,支持最新PCIe 5.0。通过PCIe扩展,最多可以支持10张包括最新NVIDIA H800 GPU在内的,多类型、多品牌AI加速卡。可以灵活应用于AI通用模型训练、大模型推理、AI生成、云游戏、科学计算等多种应用场景,为AI的多样场景提供多元算力。
会上,联想集团副总裁陈振宽强调,这两款新产品可以满足不同类型的AI应用场景需求,展现了联想对于推进AI技术发展的坚定决心。
这两款AI服务器产品不仅具备“三高一低”的优势特性,还凸显出“本地创新、敏捷高效”的品牌理念。预计在未来,这些服务器将助力AI算力在更多应用领域的深度融合,同时配合联想的领先液冷技术,为AI赋予更为绿色、高效的能源支撑,确立联想在AI领域的领导地位。
关键词: