5.7GHz 128 核心!Tachyum 发布神奇 5nm 处理器:“通吃一切”

5 月 14 日消息,据 tom'sHardware 报道,Tachyum 缔造了世界上很壮大的处分器之一:Prodigy T16128 通作用分器。Prodigy T16128 领有 128 个 64 位 CPU 内核,运转频率高达 5.7GHz,另有 16 个 DDR5 内存掌握器和 64 个 PCIe 5.0 通道,能够处分通用计较、高机能计较 (HPC) 和 AI 工作负载 —— 全部这些都应用单个芯片。

Tachyum 将 Prodigy 称为世界上初次个“通作用分器”,并显露从一首先就被计划为能够或许运转众多世界上很集中的计较应用程序的多用途 CPU。Prodigy 不但在单个芯片上处分全部这些差别的使命,并且功耗估算比古代硬件低落到 10 分之一,老本惟有三分之一。

Tachyum 斗胆鼓吹 Prodigy 超等计较机芯片的机能是环境趋势上英特尔很快的 Xeon 芯片的四倍,在高机能计较应用中的原始机能是 Nvidia H100 的三倍。同时,能效进步了 10 倍。

Tachyum 显露,为了在单核架构中缔造云云使人印象深入的机能,它重新首先构建了具备矩阵和矢量处分才气的 Prodigy,而不是背面才思量它们。Prodigy 支撑一系列数据范例,包含 FP64、FP32、TF32、BF16、Int8、FP8 和 TAI,全部这些都来自各个 CPU 内核本身。

Prodigy 处分器在 2023 年问世时可能会转变游戏规律。AMD、英特尔和 Nvidia 的很新服务器硬件都依附于单个硬件 —— 即便在单个 CPU 或 GPU 中 —— 来实行这些差别的工作负载。这方面的一个例子是 Nvidia 的 RTX 系列 GPU,它需求专用的机械借鉴 Tensor 内核才气使 AI 工作,而专用的 RT 内核则需求用于亮光追踪应用程序。

另一方面,Prodigy 将能够或许在单个内核上运转亮光追踪和 AI 应用程序,并且不需求将数据转移到微处分器里面的另一个芯片上。

在单个芯片内运转全部这些差别的 HPC 工作负载可能会极大地转变服务器款式:公司将能够或许将更多芯片打包到服务器场中,同时低落功耗和冷却。

Prodigy T16128 接纳未知起原的 5nm 工艺技术运转,并在很小的(就其供应的功率而言)64 毫米 x 84毫米 FCLGA 封装内运转。Tachyum 显露,在 HPC 工作负载方面,该芯片能够或许实行 12 AI PetaFLOPS 和 90 TeraFLOPS。Prodigy 芯片还能够运转适合于 x86、ARM、RISC-V 等指令集架构的二进制文件。从某种角度来看,单个 Nvidia A100 只能完成 5 AI PetaFLOPS。

每个内核分外能够或许实行 2 个 1024 位向量单位、4096 位矩阵运算和每个时钟 4 个乱序指令。还支撑假造化和超级 RAS。该芯片还包含超过 128MB 的具备纠错功效的 L2+L3 高速缓存。为了满足其全部内核的需求,该芯片融合了 16 个 DDR5 内存掌握器,额定速率高达 7200MT / s,每个插槽的很大容量为 8TB。

T16128 是 Tachyum Prodigy 系列中的旗舰型号,产品仓库中的中端和入门级插槽分别有 64 核 T864 和 32 核 T832。芯片制造将于 2023 年首先,所以我们应当会在来岁某个时候看到这些芯片的现实基准测试机能。

您可能还会对下面的文章感兴趣: