在x86数据中心构架上,英特尔至强拥有独一无二的优势。在日前英特尔至强数据中心处理器发布会上,英特尔不仅发布了代号为“Sapphire Rapids”的第四代英特尔至强可扩展处理器、代号为“Sapphire Rapids HBM”英特尔至强CPU Max系列,并且还发布了代号“Ponte Vecchio”英特尔数据中心GPU Max系列。数据中心CPU和GPU产品的同步发布,标志着英特尔对数据中心产品的统合进入到新的阶段,英特尔将在XPU战略基础上向用户提供更为丰富、更多层次的数据中心解决方案。
近年来,英特尔至强可扩展处理器在市场中拥有绝对的号召力,据悉,英特尔至今为止已经向全球客户交付了超8500万颗至强可扩展处理器,而上一代(第三代)英特尔至强可扩展处理器近两年时间出货近1500万颗,要知道,这样的成绩是在疫情持续影响的情况下拿出的,可以看出英特尔在数据中心市场上的掌握力。尽管面临“经济的挑战、疫情的挑战、供应链的挑战”,英特尔市场营销集团副总裁兼中国区总经理王稚聪依旧认为中国市场拥有全球无可比拟的巨大潜力,而且随着2023年中国走入后疫情阶段,近十年在中国快速发展的节奏依旧不会改变。
王稚聪谈及到了两个经济指针(发展机遇):其一是来自IDC的数据,截至目前,中国的物联网市场规模已经达到了2900亿美元,一跃成为全球第一大的IoT市场机会,从而深刻影响我们的计算和行业的整体格局;其二是2023年中国的企业级ICT的开支有13%的跃升,所以专业机构对中国今年尤其是下半年的业务恢复还是抱有很大的信心。背后蕴藏的基本逻辑还是坚信中国经济发展的活力以及动力,以及整个产业界所有合作伙伴们企业家的精神,以及执著的继续奋进的动力。
正是在这样的背景下,为英特尔至强服务器产品创造了稳定前进的产业基础。而在产品端,此次发布的第四代英特尔至强可扩展处理器以及未来几代至强服务器产品均拿出了令人信服的产品进展:
英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰展示第四代英特尔至强可扩展处理器及其晶圆
在发布会上,英特尔市场营销集团副总裁、中国区数据中心销售总经理兼中国区运营商销售总经理庄秉翰向我们展示了第四代英特尔至强可扩展处理器等产品,我们来进一步看一下第四代至强可扩展处理器的具体规格。
在产品路线图上,第四代至强可扩展处理器依旧采用Intel 7制程工艺,采用全新的芯片架构,支持包含业界领先的DDR5、CXL 1.1、PCIe 5.0和高带宽内存。在我们看来,其特点有三个:一是采用更高性能核心;二是极大提升内核数量(前两点在之前的13代酷睿处理器构架上可见一斑);三是对提升数据中心工作负载的相关加速器进行归一化设计与命名,共提供七大“算力神器”:
4. 加速在数据分析工作负载中优化内存占用和查询吞吐量的英特尔IAA加速器;
而第四代至强可扩展处理器除了硬件构件方面带来的性能提升外,主要的算力提升正体现在这七大设计之上。可显著提高 AI、数据分析、网络、存储和科学计算等众多的性能,并为传统数据中心应用提供卓越性能。
以加速深度学习实时推理和训练性能的AMX加速器(英特尔高级矩阵扩展加速器)为例,相比前代,其AI方面的性能提升高到10倍之多(10倍性能具体指PyTorch实时推理和训练性能)。
而在应用层面,它在腾讯云AI产品的创新与实践上,分别在腾讯太极机器学习平台的基于BF16模型和INT8模型上,相对第三代至强分别提升了3.02倍和2.05倍的吞吐量;在腾讯明眸高清流体服务上,它在视频增强部分的性能提升达到前代的1.86倍,在目标检测推力部分的性能提升达到前代的1.95倍。更为重要的是,通过全新的AMX加速器,使以往需要GPU参与的基于AI的前处理,如今仅在独立CPU计算集群上就可以完成,简化了业务调度构架,极大降低了运营成本。
当然,AMX的应用提升远不仅是上述一例,我们可以看到,CPU+加速器的构架下,第四代至强可扩展处理器在通用计算能力上提升了53%,不仅如此7大加速神器共同为AI、网络、数据分析、科学计算等方面的应用上展现出大幅的性能提升(如上表)。值得关注的是,通过内置加速器,目标工作负载的平均每瓦性能提升了2.9倍,在优化电源模式下每个CPU节能高达70瓦,并且该模式对性能的影响极低,将用户的总体拥有成本降低52%~66%。
正是丰富的内置加速器,让英特尔的数据中心产品能够提供平台级的功率节省,并缓解对额外独立加速方面的需求,帮助客户实现可持续发展目标。此外,新的优化电源模式可以为某些工作负载带来高达20%的插槽节能,而对性能的影响仅有不到5%。风冷和液冷的创新进一步降低了数据中心的总能耗,且第四代至强可扩展处理器在英特尔工厂制造时,运用了超过90%的可再生电力,并同时配备了一流的水资源回收设施。
除了第四代英特尔至强可扩展处理器将PyTorch实时推理和训练性能提升了10倍之外,英特尔至强CPU Max系列在这些功能的基础上针对自然语言处理进行了扩展,将大型语言模型的处理速度提升多达20倍。在开发之上,英特尔还提供了从工作站扩展到云端、乃至边缘端的AI软件套件,不仅能大大提升开发速度,还针对400多个机器学习和深度学习AI模型进行了验证,可适应所有商业细分领域最常见的AI应用场景。
第四代英特尔至强可扩展处理器包含一系列针对高性能、低时延网络和边缘工作负载进行了特别优化的处理器产品。对于如今电信、零售、制造和智慧城市等行业正在推动更加软件定义的未来,这些处理器将发挥关键性基石作用。对于5G核心工作负载,内置加速器有助于提高吞吐量和降低时延,而电源管理的升级则提高了平台的响应能力和能效。此外,与前几代相比,第四代英特尔至强可扩展处理器在不增加功耗的情况下提供多达两倍的虚拟无线接入网(vRAN)容量。这使通信服务提供商能够将每瓦性能提高一倍,满足其关键的性能、扩展和能效需求。
第四代英特尔至强可扩展处理器和英特尔Max系列产品具备可扩展、平衡的架构,其中整合了CPU、GPU和oneAPI的开放软件生态系统,适用于科学计算和AI等领域要求严苛的计算工作负载,旨在帮助解决全球最具挑战性的问题。
英特尔至强CPU Max系列是集成高带宽内存的x86处理器,能够在无需变更代码的情况下为科学计算工作负载加速。英特尔数据中心GPU Max系列提供极高的计算密度,且具有多种产品规格以满足不同的客户需求。
IM电竞官网
英特尔至强CPU Max系列可提供64GB的高带宽内存(HBM2e),为科学计算和AI工作负载大幅提高了数据吞吐量。与第三代英特尔至强可扩展处理器的高端SKU相比,英特尔至强CPU Max系列可为如能源、地球系统建模等一系列实际应用提供高达3.7倍的性能提升。
另外,我们还看到此前代号“Ponte Vecchio”的产品正式被命名为英特尔数据中心GPU Max系列,它采用3D封装的Chiplet技术,在单个产品上整合了47个小芯片,综合实现了计算、存储、网络多项功能。而这47个裸片来自于不同的代工企业,且采用5种以上的差异化工艺节点,集成了超过了1000亿个晶体管,将异构集成的技术提升至了全新水平。正如我文首提及的,英特尔数据中心GPU Max系列和至强CPU Max系列的结合,将为英特尔数据中心解决方案上带来更为多层面、更加合理的选择,比如在生命与材料科学领域的LAMMPS处理上,便提供了12.8倍的性能提升。
可以看到,第四代英特尔至强可扩展处理器及同代际的CPU和GPU产品不仅在出色的硬件构架下带来了性能和能耗比的显著提升,凭借其出色的设计已经获得了超400个客户订单。建立在其良好势头上,英特尔在数据中心产品线路图上将带来更加可观的发展节奏:
2023年,英特尔会按既定节奏推进下一代Emerald Rapids的进展;而2024年,英特尔将进一步推进基于英特尔3工艺节点的6代至强Granite Rapids,并在其多个配置中运行多个操作系统;同期,英特尔会发布旗下首款能效核产品——提供业界领先的每瓦特性能的Sierra Forrest……这都均是改变数据中心竞争格局的里程碑级别产品。
从整合数据中心CPU和GPU产品线,到未来两代改变格局的里程碑级别产品,足见英特尔在数据中心领域的发力姿态和决心。在勇敢迎接未来的同时,英特尔并不讳言过去几年走的一些弯路——其实近几年,英特尔一直都处于外部环境挑战和内部转型艰巨的双重压力下,但英特尔有一个地方比他人做得更好,便是一直把自己视为“一个充满弹性、以客户为中心的学习型组织”,这能够让英特尔始终找回自己的竞争基点。
随着英特尔采取正确的产品策略,总结经验教训,加速执行力,提振创新力,特别是与客户及产业伙伴紧密展开合作,深耕本地市场,英特尔夺回数据中心领导力是指日可期的。个人认为,这个时间节点并不远,应该在2024年的6代至强之上。
IM电竞官网
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布IM电竞网站,本平台仅提供信息存储服务。
超3万人打出1星!《749局》口碑两极分化引热议!筹拍6年期间投资方暴雷,背后涉多家上市公司
使用这种第三方充电壳 可以轻松将所有早期苹果AirPods升级到USB-C接口
谷歌27亿美元挖走明星创始人及精英团队,Character.ai放弃AI大模型研发
当大学生放假回家没脱军训服,被小孩哥 小孩姐敬礼 最后送给他们一个帽子
我们的团队人数
我们服务过多少企业
我们服务过多少家庭
我们设计了多少方案