会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 AMD 百万兆次级 APU MI300A 量产:OpenFOAM 测试是英伟达 H100 的 4 倍!

AMD 百万兆次级 APU MI300A 量产:OpenFOAM 测试是英伟达 H100 的 4 倍

时间:2024-04-28 19:23:30 来源:兴皓娱乐网 作者:时尚 阅读:677次

    

12 月 7 日消息,次级测试AMD 在推出旗舰 MI300X 加速卡之外,量产还宣布 Instinct MI300A APU 已进入量产阶段,英伟预估明年开始交付,达H的倍上市后有望成为世界上最快的次级测试 HPC 解决方案。

AMD Instinct MI300A 加速器以创新的量产 AMD CDNA 架构为基础,经优化可实现百万兆次级性能和节能,英伟是达H的倍创新的针对 HPC 和 AI 的加速处理器 (APU),提供 24 个“Zen 4”CPU 核心和 128 GB 的次级测试 CPU 与 GPU 共享的 HBM3 内存,带来非凡的量产性能。

AMD Instinct MI300A APU 结合了 Zen 4、英伟CDNA 3 和第 4 代 Infinity 架构和互联技术,达H的倍其部分性能如下:

FP64 精度下,次级测试最高算力 61 TFLOPS

FP32 精度下,量产最高算力 122 TFLOPS

最高 128 GB HBM3 内存

1460 亿个晶体管

MI300A 的英伟封装和 MI300X 非常相似,不过前者使用了 TCO 优化的内存容量和 Zen 4 内核。

每个活动 die 有 2 个 CDNA 3  GCD,提供单独的缓存和核心 IP 池。每个 CCD 有 8 个内核和 16 个线程,因此活动芯片上总共有 24 个内核和 48 个线程。还有 24 MB 的 L2 缓存(每个内核 1 MB)和一个单独的缓存池(每个 CCD 32 MB)。

在 GPU 方面,AMD 基于 CDNA 3 架构共支持了 228 个计算单元,相当于 14592 个内核。也就是说,每个 GPU 小芯片有 38 个计算单元。

简要总结下 AMD Instinct MI300 加速器的突出功能

首款集成 CPU+GPU 封装

瞄准百万兆次级超级计算机市场

1460 亿个晶体管

最多 24 个 Zen 4 核心

CDNA 3 GPU 架构

228 个计算单元(14,592 个内核)

最高 128 GB HBM3 内存

最多 8 个 Chiplets + 8 个存储器堆栈(5nm + 6nm 工艺)

性能

AMD 再次将 MI300A 与 H100 进行了比较,得益于统一的内存布局、GPU 性能以及整体内存容量和带宽,在 OpenFOAM 测试中,性能是 H100 的 4 倍。

AMD 还证实,Instinct MI300A APU 现已出货,还将用于为下一代 El-Capitan 超级计算机提供动力,该超级计算机预计将提供高达 2 Exaflops 的计算能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

(责任编辑:焦点)

相关内容
  • 热火掀翻凯尔特人 希罗24+5+14双探花空砍61分
  • 奥斯卡同意降薪回巴西 再度进入到弗拉门戈视野
  • 科爾多瓦學院 對 獨立隊
  • 安切洛蒂:中卫回来后不会让琼阿梅尼去客串
  • 每体:巴萨与圭多谈判进展顺利 有望今夏免签他
  • 政策、品牌“花式抢客” 龙年假期汽车市场“火力全开”
  • 谷底一年
  • 魔兽世界怀旧服Plus睡袋黑科技玩法:全世界免费瞬飞!
推荐内容
  • 伊朗袭击以色列,第六次中东战争会来吗?
  • 恩佐本场1射0正1次关键传球 3次解围4次抢断
  • 尴尬:网约车公司 Lyft 财报多写一个 0,股价经历过山车一度飙升近 70%
  • 2024春节档票房80.16亿元创新高 1.63亿人次观影
  • 【在习近平新时代中国特色社会主义思想指引下——新时代 新作为 新篇章】住房保障圆了2亿困难群众“安居梦”
  • 恩佐本场1射0正1次关键传球 3次解围4次抢断