AMD每一代RDNA架构的更新在技术上都有较大的变化,技术上变得更加先进,新一代RDNA 3架构将采用MCM多芯片封装,使用WGP作为主要的计算模块传言Infinity Cache(无限缓存)也可能转向3D堆栈的设计。
近日,AMD的一项GPU新专利被发现,或许在下一代RDNA架构GPU上,会添加机器学习(ML)堆叠加速器芯片,被称为APD(accelerated processing device)。根据相关文档内容,AMD可能会在GPU芯片中集成该加速器(很可能是一个堆栈芯片),以执行机器学习任务。
图表显示,APD不但具有机器学习的功能,而且具有内存,包括了内存、机器学习功能、内存互联、芯片互联和控制器。APD内的存储器可以作为其芯片的缓存,也可以直接用于执行机器学习加速的操作,比如矩阵乘法运算。如果在APD上执行着色器任务,就会通过一个或多个芯片间互联指示一组机器学习算术逻辑单元执行相关任务。
这种AI/ML内核可能是AMD对英伟达Tensor内核的回应,或许能将GPU某些任务交予APD以提高性能,并同时为HPC或深度学习等方面的工作效率。相比于英伟达在人工智能与深度学习的投入,AMD的GPU更偏重于传统计算,即便是最新的Insinct MI200系列计算卡也是如此。与英伟达将机器学习功能集成到GPU不同,AMD则通过专用模块的方式来实现。
【来源:超能网】