浪潮信息张东:“一云多芯”落地仍面临挑战
作者 | 环球Tech2023-06-09

近年来,我国从芯片、整机、操作系统、云平台、中间件到应用软件等技术领域的创新链、产业链已初步形成,以X86、ARM、Power等不同架构处理器的为基础的产业生态框架已基本就绪。国内IT产业生态也随着新一代技术应用场景不断拓展,已经形成了多技术路线全栈式支撑能力。在数据中心建设方面,随着企业“上云用数赋智”的不断加速和深化,新场景下的算力孤岛问题逐渐凸显。

如何实现多种芯片技术路线的高效协同,以应用为导向、从系统设计视角出发,满足多芯共存、多云异构条件下的云原生环境构建,保障业务应用的稳定运行、平滑切换和线性增长,成为新一代云数据中心架构体系需要攻克的新的挑战。

对此,浪潮信息副总裁张东表示,“一云多芯“是打破小生态、构建大生态的关键纽带。同时,其在一定程度上激发了IT产业链上下游的创新活力,进而促进整体生态的协同发展。

具体来说,“一云多芯”可满足用户算力多样化需求,并且可有效规避算力孤岛。为充分发挥多元异构(不同架构、不同种类)芯片的能力优势,金融、能源等关键行业应基于多种芯片架构来构建云基础设施底座,实现多元算力的统一池化管理、统一调度以及业务的差异化部署等,逐步实现从算力并存到算力统一。

不过,张东也进一步表示,虽然“一云多芯”在云计算步新中已经成为业内共识,但在产业落地过程中仍存在多方面挑战。

首先是理念的转变。IT基础架构经过长期的发展,从大机、小机时代逐步演进到云计算时代,开放计算深入人心。但直至今日,芯片指令集、操作系统架构上的差异化依然制约着架构的横向协同,比如一个应用需要同时适配多个指令集和操作系统的问题仍然很严重。IT产业需要新的理念、新的路径、新的设计,即以CPU为核心的设计模式转变为以系统为核心的设计,以“以应用为导向,以系统为核心”构建新一代产业生态。“一云多芯”是就是这种理念的具体体现。

其次是缺乏统一的“一云多芯”建设标准、规范。算力标准化是产业的愿景,因此基于“一云多芯”打造的算力平台需要标准化、统一化、服务化。各厂商因技术能力差别导致理解和落地模式均有所不同,比如部分厂商将纳管多个独立的不同芯片架构资源池的这种模式也包装成“一云多芯”,由于无法实现真正的互联互通,对业务的连续性造成很大的风险。

对此,张东认为,基于以系统设计为核心的思维,采用以场景驱动的“硬件重构+软件定义”的融合架构,是数据中心体系结构的发展方向,可以分“有-好-优”三步走来实现一云多芯的中长期目标。

第一阶段解决“有”的问题。以云为入口,通过云操作系统实现异构处理器服务器的统一管理,覆盖国内外主流处理器,提供统一操作界面、操作方式及统一监控运维等,解决云资源池只能承载单一厂商或单一架构处理器的服务器而导致的应用无法跨架构部署、协同的问题。

第二阶段解决“好”的问题。在第一阶段的基础上,进一步实现应用的低成本跨架构切换。通过资源层、平台层和应用层的“分层解耦”设计,实现架构升级。

第三阶段是解决“优”的问题。从业务连续性的维度,我们认为“一云多芯”的终极目标是实现应用与芯片架构的彻底解耦。这需要硬件、云以及应用等产业链上下游的共同协同,完善异构架构下有效算力的量化方法,以支持应用在不同架构处理器间的等价切换。共同推动应用与云基础设施的一云多芯相结合,打造垂直一体化方案,实现应用层面的跨架构无感知切换。在标准和测评方面,联合专业软件测评机构及产业链上下游生态,形成一云多芯行业标准。

热门文章
在今天的全公司员工会议上,Meta首席执行官Mark Zuckerberg对苹果在WWDC上发布的Vision Pro做出了回应。扎克伯格说,Vision Pro没有Meta没有想到的"神奇的解决方案
2023-06-09
X