<
头闻号

临沂市嘉耕商贸有限公司

其他类型日用化学品

首页 > 新闻中心 > 至强6新品以最优TCO释放AI潜能,从云到边无忧部署
至强6新品以最优TCO释放AI潜能,从云到边无忧部署
发布时间:2025-03-06 17:50:56        浏览次数:0        返回列表

飞象原创(魏德龄/文)拥抱AI,将现有业务与新技术相融合,是如今正在被众多企业所关注的话题。但如个人用户在部署本地AI时,可能会考虑内存与算力如何与相关大语言模型所匹配的问题类似,企业在自身能力基础上需要做出更多考量,如何控制能源的消耗,获得最优的投入产出,才能免除部署疑虑,在软硬件的更新换代中实现AI融合。

近日,英特尔扩展了至强6产品组合,带来面向通用服务器负载的至强6700/6500P系列(Granite Rapids-SP)和面向网络和边缘应用的至强6 SoC(Granite Rapids-D)。两款产品均针对AI需求提供了专门的技术支持。其中至强6700/6500P系列中首次支持的MRDIMM技术,让CPU实现了对AI更好的支持。

首款支持MRDIMM的平台

至强6700/6500P系列的目标是更好地服务传统企业各种不同的广泛应用,包括最新的AI应用、传统的数据库或者是边缘、存储或不同的传统计算。

在AI工作负载需求日益增强的情况下,更快的内存带宽可以让CPU更好地支持AI。原因在于部分工作负载,如推荐系统中的某些任务,仍然依赖CPU处理且对内存带宽极为敏感。

英特尔在多年以前便开始与众多厂商进行MRDIMM技术的推进。在此次发布的至强6产品中,相比内存速度在4800-5600MT/s的第五代至强,至强6的速度已经提升到了DDR5 6400MT/s。MRDIMM更可以把这个速率大幅提升到8800MT/s。相比于现已在市面上部署的数据中心服务器,提升达到50%以上。

MRDIMM可以在第一时间大幅度提升内存带宽,能够为中小模型推理任务提供更好的性价比。MRDIMM与至强6的结合,以及与其他加速卡的搭配,将显著提升端到端业务的性能。

例如对于小规模的大语言模型而言,其推理过程不仅在生成首个Token时需要进行密集的计算,更重要的是,在后续的大多数Token推理中,对内存带宽的需求非常高。因此,至强6处理器与MRDIMM技术的结合可以带来更佳表现。

“我们的最新超级计算机将配备英特尔至强6处理器,采用P核,这是最新的处理器技术,并结合高带宽MRDIMM内存。它将为用户提供显著加速解决特定受内存限制任务的能力,这对于科学研究至关重要。”IT4Innovations超级计算服务总监Jansik表示。

同时,至强6平台上还完整地支持了业界标准CXL 2.0。其中一个突出的应用场景就是如何通过CXL2.0扩展内存,来以更高的性价比去拓展服务器的内存空间,进而满足包括AI在内对于内存总量敏感的应用场景需求。

打消部署后顾之忧

英特尔至强6700/6500性能核处理器能够提供出色的性能与能效平衡。与上一代产品相比,至强6处理器在广泛的企业工作负载中实现了平均1.4倍的性能提升。作为AI系统的机头节点CPU,至强6可与GPU搭配,为客户提供优选组合。

此外,它以更少的核心数量,提供高达1.5倍的AI推理性能提升。能够在如大数据、科学计算、AI、网络等应用中,以在同样能耗的情况下,带来更加显著的性能提升。以5年使用周期计,平均可以实现以一台新的服务器替代五台旧服务器5,在某些用例中该比例可达10:1,从而节省高达68%的TCO。

得益于至强内置的AMX加速引擎,在同等核心数下,至强在矢量数据库离线构建索引表的过程中,性能甚至可以高过友商30%。另在图片分类这样的传统AI领域最高可达50%以上的性能提升。

英特尔还关注到了由AI部署所产生的AI隐忧,针对进入到AI时代后异构系统的普及,业界希望英特尔可以和其他加速卡生产商一起联合构建一个不仅包含CPU,同时也包含GPU的硬件防护的体系。至强6中的TDX Connect技术构建了一个CPU与GPU整体的防护网,无论是放在CPU上的数据抑或是业务入口,又或者运行在GPU上的模型参数或是模型数据,都能得到硬件防护。这也意味着,即便是一台云主机,云服务提供商也无法获取用户的任何数据。

“Intel TDX Connect代表了提升机密计算的一大里程碑,增强了性能和可扩展性。它使现有和全新的工作负载能够受益于机密计算的隐私保障,而不会在成本或性能上妥协。”微软Azure产品主管Vikas Bhatia表示。

显然,在云端至强6700/6500P系列解除了企业在面对各类任务流时的掣肘,在与AI业务相关的任务中,无论是如图像识别、语言处理、推荐系统等这类经典AI模型,还是中小参数量的大语言模型,都能在保证安全的情况下,以更小的能耗,带来更优的性能表现。

借助融合降低TCO的全新SoC

在边缘侧,以电信运营商为代表的厂商同样正在思考AI融合的问题,将传统的网络在连接功能基础上引入智能与算力。以AI应用为例,边缘服务器可应用于智能工厂,助力矿山开采作业,亦能用于智能摄像头相关场景。此类设备会集成多种网络功能,如SD-WAN,同时整合安全功能。更为重要的是,它可以将各类AI应用集成于一体,例如智能监控与安全监控应用。

本次同期推出的至强6处理器便是一款专为网络和边缘应用设计了一款全新SoC。该产品是专门面向运营商,针对网络和边缘应用而设计的。对多样化的功能特性进行了高度集成,整合了英特尔至强6性能核处理器的特性,将核心提升至72个,并整合多种加速器,例如面向vRAN的vRAN boost技术、面向媒体的英特尔媒体转码加速器,以及面向AI加速的英特尔高级矩阵扩展。

作为一颗系统芯片,至强6处理器实现了功耗与性能的平衡。例如在与诺基亚的合作中,提升了70%的性能功耗比,帮助运营商提升了整体密度,带来高达2.4倍的无线接入网工作负载容量提升;另外在AI领域,该产品内置新的英特尔高级矩阵扩展英特尔AMX,让单核AI RAN性能较上一代提升3.2倍;在网络安全领域,该产品实现了Webroot CSI上传模型的推理速度大幅提升,相比于英特尔至强D-2899NT处理器,提升最高可达4.3倍。

至强6处理器还是首款内置媒体转码加速器的服务器SoC。得益于此在编解码任务时可实现较大性能功耗比的提升。相较于英特尔至强6538N处理器,每瓦性能提升达到了14倍。在Synamedia已经采用了至强6系统级芯片,实现了编解码的每瓦性能提升。另外还能帮助传统VDI领域,提升媒体的处理效率,减少总体拥有成本。

“业界常常讨论智算网融合,原因是希望可以有一个基础建设能用到不同场景中,让你的‘投资’不会被锁到某一个领域当中。所以为了经济性,我们的看法是选一个可以支持各种应用的平台,不管是网络、AI、网络边缘还是控制的应用。”英特尔中国网络与边缘事业部总经理阮伯超表示。

英特尔同样以这一原则来设计产品,无论是选择AI应用、网络部署还是边缘控制,英特尔的产品均基于同一开发平台实现。通过软件层面的差异化配置,可以满足不同应用场景需求,无需分别为网络、AI搭建独立平台。借助这一融合平台,能够最大程度降低总体拥有成本。

目前至强6能效核处理器,已经用在很多的5G网络中,通过与业界伙伴的合作,其性能得到了充分发挥。经5G核心网解决方案合作伙伴独立验证,该处理器实现了3.2倍的性能提升、3.8倍的每瓦性能提升。此外,配合在MWC24上推出的英特尔基础设施电源管理器软件,运行时功耗更可降低60%。

至强6新品正在以最优TCO释放AI潜能,让企业能够从云到边无忧部署,不仅助力高效应对AI计算挑战,还在云端、边缘等多场景下提供更优的能效表现,让AI融合之路更轻松、更经济、更具未来价值。