如果您希望可以时常见面,欢迎标星收藏哦~
今天,Ampere 的年度视频包含了一些重大更新,包括计划于 2025 年推出的 256 核 3nm Arm 服务器 CPU,配备 12 通道 DDR5 内存。听起来 Ampere AmpereOne 一代已经处于规划阶段,计划于 2026 年推出。
Ampere AmpereOne 更新 256 核 12 通道 Arm CPU 即将推出
首先,让我们讨论一下路线图。AmpereOne 使用该公司的定制 Arm 内核,并计划扩展到 192 个内核。多年来,我们在Ampere Altra 上做了很多工作。该设计使用 Arm Neoverse 内核,每个插槽可扩展至 128 个内核,配备 DDR4。我们尚未测试的 AmpereOne 一代,但我们已经看到实际上有两个不同的平台。一种是8通道DDR5平台,如上图所示。第二个是12通道DDR5平台,我们还没有能够展示,但大约一年前在Computex 2023上看到过。其中一个 AmpereOne 平台实际上是我们看到的第一个采用分体式主板的平台,其中插槽一个在顶部,一个在底部,插槽之间有电缆连接。我们希望向您展示这种设计,因为它确实与众不同。
除了新的 SKU 之外,AmpereOne 还具有一些新功能。首先是 AmpereOne FlexSpeed,它可以在不重新启动的情况下提高确定性的时钟速度。第二个是 AmpereOne FlexSKU,它允许在 BIOS 中调整芯片的核心数和频率,以便可以部署一个更高核心数的 SKU,然后重新配置服务器以具有不同数量的活动核心、时钟频率和 TDP 。我们已经看到采用 Intel Speed Select 技术 – 性能配置文件 的 Intel CPU,可以执行类似的操作。
Ampere 表示,AmpereOne 将提供比 AMD EPYC“Bergamo”更高的每瓦性能。据称,两者均自 2023 年开始发货。我们将在本文末尾添加尾注,但需要记住的是,Ampere 使用的是估计分数,并且还降低了AMD EPYC Bergamo性能标准化它达到了 GCC 13 的性能。如果 733 SPECrate2017_int_base 分数看起来低于我们通常Bergamo预期官方分数的 950+,这是由于编译器差异造成的。
如果 Ampere 提高时钟速度和电压以获得与Bergamo相似的分数,那么看看这些部件在效率基础上的接近程度将会很有趣。将 AmpereOne 从 192 个核心的 2.6GHz 提升到 3.1GHz,CPU2017 整数速率提高了 78,但功率增加了 62W,每 W 略高于 1.25。按照这个速率,AmpereOne 仍然领先,但如果效率没有按沿着 V/F 曲线向上走,那么最终可能会非常接近。
Ampere 的另一个重大推动力是进行 CPU 推理的想法。Ampere 正在与NVIDIA A10 GPU 进行比较,后者不一定是 NVIDIA 为它提供的 2021 年 GPU 中性能最好的。尽管如此,我们的想法是,CPU 推理可以在通用基础设施上完成,而不是部署专用加速器。
Ampere 还希望成为 AI 平台联盟的其他公司制造的 AI 加速器背后的 CPU 核心。
作为其年度更新和人工智能目标的一部分,Ampere 还重点介绍了在 Supermicro 服务器中采用 Qualcomm AI 100 Ultra 加速器的解决方案。
Ampere 还拥有配备 NETINT 智能 VPU Quadra T1U 的 Supermicro 设备,用于视频转码。
这是合作伙伴的幻灯片,比2020 年我们在 Ampere 总部看到 Ampere Altra Q80-30 实际使用时要大得多。
Ampere 2024:又向前迈出了一步
按照现在的传统,安培计算发布了年度路线图更新。在 2024 年的披露中,该公司重点介绍了其 AmpereOne 产品线的胜利、与合作伙伴的合作、如何提供 SKU 差异化以及一些产品/性能数据。其中一些新闻只是“对商业有利的东西”,但也包含一些竞争分析。我多年来一直关注安培,虽然这次更新展示了该公司的良好前景并不断向前发展,但我仍然有一些长尾问题。
安培计算,或简称为“安培”,在半导体领域是罕见的。在经历了十几家失败之后,该公司是唯一一家在公开市场上销售基于 Arm 的服务器处理器的公司。这一成功部分归功于员工——正如首席执行官 Renee James 在 2023 年 12 月的一次采访中向我解释的那样,他们从那些失败的尝试中聘请了专家来学习并确保他们不会陷入同样的陷阱。
如今,基于 Arm 的企业服务器处理器有很多:有 NVIDIA 的 Grace、亚马逊的 Graviton 系列、谷歌的 Axion 和微软的 Cobolt。不同之处在于,这些处理器不是在公开市场上以零售方式出售,而 Ampere 的产品线却是这样设计的。
Ampere 拥有两条产品线 - Ampere Altra/Altra Max 和 AmpereOne。从技术上讲,这个名字可能是Ampere AmpereOne。产品线在核心数量、核心微架构和目标市场方面存在差异,Altra 于 2020 年发布,AmpereOne 于 2023 年发布。
Altra/Max SoC提供多达 128 个使用 TSMC N7 的 Arm Neoverse N1 内核和 8 个 DDR4 通道。它是单片的,首先是 80 核 Altra,其次是 128 核 Altra Max。该堆栈的顶部是 M128-30,它在 3.0 GHz 下分解为 Mystique-128 内核。Ampere 确保核心在任何工作负载下以 3.0 GHz 运行,无论复杂程度如何,以便提供可预测的性能。
AmpereOne SoC 代号为“Siryn”,使用完全定制的内部开发的 Arm v9 内核。关于这个核心的一些小细节是已知的——Ampere 悬而未决的问题之一是围绕微架构披露的。目前该部件已提供 128 至 192 个核心,采用 TSMC N5 构建,并使用 8 通道 DDR5。
该公司在全球拥有超过 1500 名员工,专注于“可持续计算”,即提高云 CPU 插槽的效率。到目前为止,我们认为主要客户是 Oracle,Altra 已经出现在 Google Cloud 和 AWS 的多个在线云实例中。
今年,AmpereComputing 宣布扩展 AmpereOne 系列。除了顶级 192 核部分之外,还将推出 256 核版本。有趣的是,这款产品是基于台积电 N3 构建的,但将包含与以前相同的核心设计。目前该工厂已做好投产准备,预计在 2024 年底或 2025 年初向合作伙伴提供。
虽然 OG AmpereOne 是 192 核和 8 通道 DDR5,但也会有 12 通道 DDR5 版本。256 核心仅提供 12 通道。由于 DDR5 需要多少引脚的性质,这些 12 通道部件将使用不同的主板。
有关这些参数和对比,在上文已经有阐述了。
其实对于这家公司,老实说,有时很难知道他们的位置。他们是唯一一家销售此类基于 Arm 的 CPU 芯片的公司。他们不公布财务业绩,因为他们不需要这样做——它仍然是一家初创公司。我听说他们的大多数客户确实喜欢保持沉默,这使得公司很难宣传其胜利并让外界评估公司的扩张情况。尽管推出了AmpereOne,但该公司对核心设计仍处于保密状态,因此很难进行比较。
打入一个成熟的市场是很困难的。高通将于今年晚些时候在 HPC 领域尝试基于 Arm 的 Oryon 芯片,试图打破 x86 的束缚。Ampere 正试图在云领域做类似的事情,英特尔和 AMD 处于领先地位。软件始终是一个挑战,但是随着云提供商推出自己的 Arm 芯片的出现,云软件正在转向与架构无关。但是,云提供商正在推出自己的产品而不是购买 Ampere,这一事实表明该公司很难被采用。云提供商正在针对自己的工作负载进行优化 - 他们只向自己销售,而 Ampere 必须向所有人销售。
由此推论,全球有超过七家云供应商。世界各地有大量二级、三级或主权设施,为中小型企业提供服务或为大型企业提供本地化服务。其中一些主权云的预算高达数十亿美元,而这些钱传统上都花在 x86 硬件上。鉴于大型云定制芯片无法提供给该市场,这可能是一个潜在的途径。
在 CPU 核心方面,随着市场转向 AI,人们不再那么重视这些系统中 CPU 核心的功能 - NVIDIA 正在使用 Arm Neoverse 核心,“因为客户更关心 +10% 的性能”据他们称,“GPU”。相比之下,Ampere 表示,他们的客户会争夺硬件的每一点性能,而采用定制核心设计可以与使用标准现成设计的每个人实现更大的差异化。如果/当公司进行首次公开募股时,这些年度更新将受到比现在更多的审查。
然而,几个月前我对首席执行官蕾妮·詹姆斯 的采访颇具启发性——我确实对这家公司有了更大的赞赏。它们比你想象的要大,而且很明显,芯片中含有大量可能是针对特定客户的秘密武器,但他们永远不会告诉我们这一点。但如果你想要硬件,只是为了玩玩,那么你今天就可以去购买。
点这里加关注,锁定更多原创内容
今天是《半导体行业观察》为您分享的第3768期内容,欢迎关注。
『半导体第一垂直媒体』
实时 专业 原创 深度
公众号ID:icbank
喜欢我们的内容就点“在看”分享给小伙伴哦