联想logo

重磅来袭!联想万全异构智算平台正式发售

2024-06-13 19:18:34

      日前,联想万全异构智算平台正式上线发售。联想万全异构智算平台面向通用计算、科学计算与AI算力等多个领域,通过创新技术显著提升算力效率。


      当前,“大模型+大算力+大数据”已成为新一代人工智能发展的基石。然而,智能计算的投入成本和技术门槛高于通用计算,因此广大用户急需一个全新的计算开发与管理平台。


      顺势而为,抢先布局。联想基础设施业务群精心打造了联想万全异构智算平台,它集成了五大创新技术:算力匹配魔方、GPU内核态虚拟化、联想集合通信算法库、AI高效断点续训技术以及AI与HPC集群超级调度器,为用户提供了一个高质量、高标准的异构智算解决方案。




       该平台能高度自动化地完成AI全流程开发,提供高可用算力,并持续突破计算效率瓶颈。用户不仅可以自动完成AI计算并发布模型或推理服务,还能手动深入调整计算过程,包括选择工具和模型、调整算力配置以及对任务进行定制化监控。它不仅能助力用户实现AI全流程开发的高度自动化,降低业务TCO(全周期使用成本),加速应用部署,还能管控异构,实现智算的无边界。




具体而言,联想万全异构智算平台具有以下核心产品特性:


算力匹配魔方


首先,算力匹配魔方可智能匹配用户算力需求

基于海量硬件评测和AI算子算法集成工作

联想构建了算力魔方知识库

标识了AI场景、算法与集群配置的匹配关系

用户只需输入场景和数据

算力魔方即可自动加载最优算法并调度最佳集群配置




GPU内核态虚拟化


其次,GPU内核态虚拟化技术可逼近GPU算力极限

联想研究院开发的虚拟化算法

可将GPU算力损耗降至极低水平

大幅提升GPU利用率




联想集合通信算法库


此外,联想集合通信算法库能提升网络通信效率

它可实时感知多种网络拓扑

并通过先进算法优化数据传输路径

以千卡规模集群为例

采用该算法库可使网络通信效率提升超10%

且集群规模越大效果越显著




AI高效断点续训技术


同时,AI高效断点续训技术可减少AI训练中断时间

通过特征采样和AI模型预测训练故障

该平台能在断点前优化备份

将断点续训恢复时间缩减至分钟级

大幅提高训练效率并节约算力费用




AI与HPC集群超级调度器


最后,AI与HPC集群超级调度器

可满足混合集群资源共享需求

它可切换AI和HPC调度模式

实现跨集群全局动态管理和调度算力资源

一小时内自动完成跨集群资源调度和共享




       总而言之,联想万全异构智算平台是AI 2.0时代,联想中国基础设施战略框架的核心,它是AI 2.0时代大模型训练和推理的基础设施底座。作为“一横五纵”战略框架的核心,联想万全异构智算平台与服务器、存储、数据网络、软件及超融合以及边缘基础设施产品和方案,共同构成联想AI导向基础设施的完整体系。这一体系将为企业智能化转型提供坚实可靠的智算底座,助力各行业实现智能化升级。