英特尔发布Xe2战斗法师GPU架构首发搭载低功耗LunarLakeCPU
Battlege在Alchemist迭代的基础上带来了不少架构改进,包括更高的效率、更强大的光线追踪单元和优化的可扩展性。这种新架构将首先在LunarLakeCPU中推出,但桌面和HPC版本应该会稍后推出。
在Computex主题演讲之前,英特尔在英特尔技术巡展上发布了更多有关即将推出的代号为“Battlege”的Xe2GPU架构的详细信息。虽然之前有关英特尔下一代GPU架构可能推迟甚至彻底取消的传言现在看来毫无根据,但看起来Battlege不会同时以GPU和iGPU形式推出。英特尔计划首先推出适用于LunarLake处理器的低功耗版本,然后在稍后发布桌面和HPC版本。因此,英特尔仅展示了LunarLake芯片中iGPU的估计性能提升。
借助Xe2BattlegeGPU架构,英特尔专注于提供更高的利用率、改进的工作分配和减少软件驱动程序开销。谈到与XeAlchemist相比的性能提升,英特尔承诺将提高12.5倍的绘制调用、7倍的计算调度和4.1倍的网格着色器调度,这只是最大的改进。不过,对整体性能影响更大的方面,如顶点处理、曲面细分、光线三角形和光线追踪,最多可提高2倍。
每个Xe2核心都具有8个512位矢量引擎、8个2048位XMX引擎、b原子操作支持和192KB共享L1缓存/SLM。与XeAlchemist类似,Xe2Battlege具有高度可扩展性,并将根据产品堆栈配备一定数量的核心。例如,LunarLakeiGPU将配备多达8个Xe2核心,包括个矢量引擎、2个几何管道、8个采样器、4个像素后端、8个光线追踪单元和8MBL2缓存。
英特尔升级了所有矢量引擎,使其具有SIMD16原生ALU,同时支持SIMD32操作,而XeMatrixExtensions支持INT2、INT4、INT8。FP16和BF16操作。FP16操作的处理速度已提升至2048OPS/时钟,INT8速度可达到4096OPS/时钟。
为了减少延迟并改善硬件/软件握手,英特尔引入了渲染切片作为渲染引擎的基本块。这些切片也是可扩展的,可以根据GPU类型进行堆叠和优化。此外,光线追踪单元也得到了改进,包括3个遍历管道、18个框交点和2个三角形交点。
英特尔预计LunarLake处理器上的Xe2iGPU将比MeteorLake上的XeAlchemist型号快50%。另一项改进是支持eDisplayPort1.5的新显示引擎,它将提高电源效率并改善自适应同步功能,同时减少笔记本电脑显示屏上的抖动。此外,英特尔正在使用专用的8MB缓存更新媒体引擎,这应该会提高编码工作负载的电源效率,此外它还引入了对新VVC(多功能视频编码)标准的支持,允许1质量并将文件大小减少10%。
标签: