中山大学虞志益:异构计算融合通用和专业芯片优势 引领封装技术加速发展

随着近年来硅芯片逼近物理的极限和经济成本高升,摩尔定律已趋近失效。使用通用处理器这个传统的方法已无法满足人工智能的各种应用对爆发的和高计算能力的需求。因此,具有GPU、ASIC、FPGA或其它加速器(Accelerator)等高并行、高密集的计算能力的异构计算持续火热,而异构计算也将成为支撑先进和以后更复杂AI 应用的必然的选择。

异构计算(Heterogeneous Computing)是指使用不同类型指令集和体系架构的计算单元组成的计算系统。通常情况下,异构计算架构的芯片中既有CPU等传统的通用计算单元,也有高性能的专用计算单元。与传统的通用计算芯片相比,异构架构具有高性能、低功耗等显著优点。

在AI和5G场景下,异构系统高性能、低功耗的优势逐步显现,正在逐渐成为主流的芯片架构。那么在万物互联下,传统计算创新遇到了哪些挑战?新计算时代,异构计算将如何助力突破?异构计算的实现需要哪些技术支撑?未来十年异构计算将带来哪些新机遇?

围绕这些话题,在第十期“集微龙门阵”上,集微网邀请到中山大学微电子科学与技术学院教授、副院长虞志益进行了分析探讨

点这里观看回放

万物互联下,传统计算架构性能提升遭遇瓶颈

据虞志益介绍,在80年代,处理器的时钟频率只有十几兆,后来变成了几十兆、几百兆,到2005年,变成了4G左右。在之后的15年的时间,高性能处理器的时钟频率一直没有大的变化,性能提升缓慢。功耗方面,每平方厘米的功耗从十几毫瓦变到一瓦左右,也到达了一个极限,并限制了性能的提高。

在互联网行业,随着信息化的普及,数据量的暴增使得人们对存储空间又有了新要求,同时,5G、机器学习、人工智能、无人驾驶、工业仿真等领域的崛起,使得通用CPU在处理海量计算、海量数据/图片时遇到越来越多的性能瓶颈。

对此,虞志益指出致使传统处理器芯片性能提升非常缓慢的五大因素:一是在处理器技术方面,包括流水线、超标量、存储的hierarchy、多核等日趋成熟,能够挖掘的新的技术越来越少;第二个是功耗,功耗成为了一个非常大的制约因素,它制约了性能提升;其三,先进制造工艺日趋极限,目前摩尔定律再往下推会越来越难,追求高端工艺的企业越来越少;第四是设计成本和制造成本在不断的攀升;最后一个是应用的增长在逐渐放缓

“这一系列的挑战就希望有一个新的计算芯片,新的处理芯片,它能够有新的高性能技术,新的低功耗技术,能够有更好的灵活性,还能够支持新的应用。 ”虞志益说。

新计算时代,需要器件、设计、软件算法的融合

在阐述性能、功耗效率、灵活性之间的关系时,虞志益表示,一般来说,性能、功耗效率和灵活性之间很难用一种模式来解决。不同实现方式的功耗效率非常不一样。比如:CPU、GPU、DSP和ASIC,它们的功耗效率是非常不同的。ASIC的功耗效率可以是 CPU的几百倍甚至上千倍,但是 CPU很灵活,而ASIC只能针对某一个特定的应用。

“异构计算的优势就是可以把通用的 CPU和专业的芯片(如ASIC)融合在一起,得到性能、功耗和灵活性的统一。”虞志益说。

谈到未来处理器的一些变化和突破口时,虞志益指出,在技术层面,主要有这几点:一是从通用的同构的处理器转变到通用和专用混合性的异构处理器;二是3D封装,新型封装在在异构处理器和异构系统中扮演着重要角色;三是CMOS集成电路转变为CMOS与其他器件混合;四是非冯诺依曼结构,冯诺依曼结构已经统治这么多年,以后可能需要非冯诺依曼结构实现一个更好的功耗效率。非技术层面,以后会从纯粹技术的推动转变成技术推动和应用驱动并重的局面

“另外,以后将是芯片、封装、系统、软件的协同,它不是单一的技术点,而是多技术点的综合,所以涉及器件、设计、软件算法等的融合,以实现一个高效的异构系统。”虞志益补充道。

异构计算的实现需要解决三大技术问题:架构、互连和编程

异构计算需要解决很多问题,在此次龙门阵上虞志益详细介绍了异构计算需要的技术支撑。

首先是一个架构的选择,事实上异构计算不是一个新的技术,其实有很多选择的,比如 ASIP、BigLittle、CPU+GPU、CPU+FPGA、CPU+ASIC等。而选择什么样的结构现在还没有一个标准答案,还需要学界和工业界继续分析。可以肯定的是不会有某一个方案来统一天下,更多的可能是各种方案并存。比如,在低功耗领域可能是CPU+ASIC比较好,在通用的领域可能是CPU+GPU或者CPU+FPGA比较好,不同的应用领域需要的架构是会不一样的。

第二个问题是互连。互连问题主要有这几个方面,一是互连的需求,当不同芯片里面有不同单元的时候,互连就会比较的复杂,会提出很多要求,比如高性能、低功耗、可扩展性、能够支持不同的异构节点、缓存一致性的等等。二是互连方式,比如bus、crossbar、NoC等,不同的互联方式是选一个还有折中,也是一个需要去探索的关键技术。三是通信方式,比如shared-memory、message passing等,同样面临选择一个还是融合起来的问题。四是交换方式,现在有包交换、电路交换等不同的技术。五是片上互连、片间互连(新型封装)不同方式。再有就是互连标准,现在有很多标准,比如CCIX、OPENCAPI、NVLINK、OPENAPI等,还没有统一的方案支持互连。

第三个就是编程的方式,目前有不同的编程的方式,比如CUDA、OPENCL、OPENACC、HAS、HLS等,需要一个好的编程方式让从业者更好接受。现在做硬件的人对于编程的接受度和做软件的人接受度是不一样的,不同的学科的人,他们对于编程的接受度也是不一样的,这就需要一个更好的编程模型,让更多的人能够接受,这是非常难的挑战。

虞志益还介绍了其以前做的一个异构平台,里面包括三种芯片,第一个是多核芯片,第二个存储芯片,第三是加速芯片。虞志益表示,未来的系统里面可能最关键就这三大类。

“在这个平台上,用了2.5D/3D封装集成,核的数量、存储容量、加速器可重构可以各种搭配,这样性能、功耗效率和灵活性能够适当折中,比较快的形成一个合适的系统。”虞志益说。

未来,异构计算将加速封装技术发展

异构计算最重要的技术之一是封装,目前设计和制造技术发展已经很快了,封装技术发展速度相对比较慢,封装有可能在异构计算的基础上快速发展。”谈及异构计算带来的新机遇时,虞志益说。

最后,虞志益表示,异构计算的发展需要从系统、软件、算法等多方面融合,需要各个技术方面有更好的interface。而从产业角度来说,一是用异构计算提升现有的产品,二是用异构计算驱动未来的发展。最后,在教育方面,希望教育能够跟上产业的发展。

(校对/ Humphrey)

发表评论

邮箱地址不会被公开。 必填项已用*标注

Related Post