Arm的下一代GPU架构快了近200%
在本周的 DevSummit 会议上,Arm 表示,就 FP32 机器学习性能而言,与今年的 Arm Mali-G710 相比,2022 年推出的下一代 GPU 架构的性能几乎翻倍。与 2018 年的 Arm 上一代架构相比,新 GPU 在上述工作负载中的速度几乎是 5 倍。
在 DevSummit 上,Arm 的 ML 业务部门高级技术总监 Ian Bratt 展示了一张幻灯片,展示了 Arm GPU 架构的机器学习性能的进步有多快。就每核性能而言,该公司的 2022 GPU 架构现在预计在 FP32 ML 工作负载中比 Mali-G76 快 4.7 倍。GPU 核心是一组执行单元、纹理单元、光栅单元和其他特定于应用程序的硬件。
目前尚不清楚 FP32 ML 性能提升如何影响游戏性能或整体每瓦性能,但我们知道最新的 Arm Mali G-710 在 ISO 下提供 35% 的 ML 性能和 20% 的图形性能-流程节点 GPU 配置与 Mali-G78 实现的比较。也就是说,很明显 ML 性能对 Arm 有多么重要。与此同时,Arm 需要确保软件开发人员拥有利用其最新技术的工具。
据The Register报道,Bratt 说:“这不仅仅是添加指令和改进硬件 IP,我们还必须提供软件、工具和库来实现 ML 性能 。”
近年来,Arm 显着加快了其 GPU 架构的发展。过去,Arm 可以在单一 GPU 架构上运行大约五年,虽然该架构在每核性能和支持的内核数量方面随着时间的推移发生了相当有意义的发展,但这些架构性能增强并没有正是突破。从 2016 年开始,Arm 进入了为期三年的 GPU 架构节奏,同时每年继续推出其架构的新迭代。
这种加速导致了功能和性能的快速演变。例如,就每核图形性能而言,今年推出的 Mali-G710(基于 Valhalla 3 架构)比 2018 年宣布的 Mali-G76(Bifrost 3 架构)快两到三倍。
如果(或何时)全球监管机构批准该公司被英伟达收购,Arm 的 GPU 架构将如何发展还有待观察。这家总部位于加利福尼亚州圣克拉拉的公司是全球最大的独立 GPU 以及用于各种工作负载(包括机器学习)的计算 GPU 供应商,因此目前尚不清楚 Nvidia 是否会继续开发 Mali GPU,还是会重新分配 Mali GPU 开发人员它自己的架构。
标签: