跟着人工智能工业链的火速延伸,GPU并不能满意一切场景(如手机)上的深度学习核算使命,GPU并不是深度学习算力痛点的仅有解。现在以深度学习为代表的人工智能核算需求,首要选用GPU、FPGA等已有合适并行核算的通用芯片来完成加快。
在工业运用没有大规划鼓起之时,运用这类已有的通用芯片能够防止专门研制定制芯片(ASIC)的高投入和高危险。可是,因为这类通用芯片规划初衷并非专门针对深度学习,因而天然存在功用、功耗等方面的瓶颈。跟着人工智能运用规划的扩展,这类问题将日益突出。
一项深度学习工程的建立,可分为练习(training)和揣度(inference)两个环节:练习环境一般需求经过许多的数据输入,或采纳增强学习等非监督学习方法,练习出一个杂乱的深度神经网络模型。练习进程因为触及海量的练习数据(大数据)和杂乱的深度神经网络结构,需求的核算规划十分巨大,一般需求GPU集群练习几天乃至数周的时刻,在练习环节GPU现在暂时扮演着难以容易代替的人物。
揣度(inference)环节指运用练习好的模型,运用新的数据去“揣度”出各种定论,如视频监控设备经过后台的深度神经网络模型,判别一张抓拍到的人脸是否归于黑名单。虽然揣度环节的核算量比较练习环节少,但依然触及许多的矩阵运算。在揣度环节,除了运用CPU或GPU进行运算外,FPGA以及ASIC均能发挥严重效果。
FPGA(可编程门阵列,FieldProgrammableGateArray)是一种集成许多根本门电路及存储器的芯片,可经过烧入FPGA装备文件来来界说这些门电路及存储器间的连线,然后完成特定的功用。并且烧入的内容是可装备的,经过装备特定的文件可将FPGA转变为不同的处理器,就如一块可重复刷写的白板相同。因而FPGA可灵敏支撑各类深度学习的核算使命,功用上依据百度的一项研讨显现,关于许多的矩阵运算GPU远好于FPGA,可是当处理小核算量大批次的实践核算时FPGA功用优于GPU,别的FPGA有低推迟的特色,十分合适在揣度环节支撑海量的用户实时核算恳求(如语音云辨认)。
ASIC(专用集成电路,ApplicationSpecificIntegratedCircuit)则是不行装备的高度定制专用芯片。特色是需求许多的研制投入,假如不能确保出货量其单颗本钱难以下降,并且芯片的功用一旦流片后则无更改地步,若商场深度学习方向一旦改动,ASIC前期投入将无法收回,意味着ASIC具有较大的商场危险。但ASIC作为专用芯片功用高于FPGA,如能完成高出货量,其单颗本钱可做到远低于FPGA。
FPGA的灵敏性,许多运用通用处理器或ASIC难以完成的基层硬件操控操作技能运用FPGA能够很便利的完成,然后为算法的功用完成和优化留出了更大空间。一起FPGA一次性本钱(光刻掩模制造本钱)远低于ASIC,在芯片需求还未成规划、深度学习算法暂未安稳需求不断迭代改善的状况下,运用具有可重构特性的FPGA芯片来完成半定制的人工智能芯片是最佳挑选。在很多范畴都有代替ASIC的趋势,据商场组织GRANDVIEWRESEARCH的数据,FPGA商场将从2015年的63.6亿增长到2024年的约110亿美元,年均增长率在6%。
虽然FPGA倍受看好,乃至新一代百度大脑也是根据FPGA渠道研制,但其究竟不是专门为了适用深度学习算法而研制,实践依然存在不少限制:榜首,根本单元的核算才能有限。为了完成可重构特性,FPGA内部有许多极细粒度的根本单元,可是每个单元的核算才能(首要依托LUT查找表)都远远低于CPU和GPU中的ALU模块。第二,速度和功耗相对专用定制芯片(ASIC)依然存在不小距离;第三,FPGA价格较为贵重,在规划放量的状况下单块FPGA的本钱要远高于专用定制芯片。
近几年来,定制芯片的功用提高十分显着。例如英伟达首款专门为深度学习从零开始规划的芯片TeslaP100数据处理速度是其2014年推出GPU系列的12倍。谷歌为机器学习定制的芯片TPU将硬件功用提高至相当于当时芯片按摩尔定律开展7年后的水平。正如CPU改动了当年巨大的核算机相同,人工智能ASIC芯片也将大幅改动现在AI硬件设备的相貌。如大名鼎鼎的AlphaGo运用了约170个图形处理器(GPU)和1200个中央处理器(CPU),这些设备需求占用一个机房,还要装备大功率的空调,以及多名专家进行系统维护。而假如悉数运用专用芯片,十分或许只需求一个盒子巨细,且功耗也会大幅下降。
下流需求促进人工智能芯片专用化。从服务器,核算机到无人驾驶轿车、无人机再到智能家居的各类家电,至少数十倍于智能手机体量的设备需求引进感知交互才能和人工智能核算才能。而出于对实时性的要求以及练习数据隐私等考虑,这些才能不行能彻底依靠云端,有必要要有本地的软硬件根底渠道支撑,这将带来海量的人工智能芯片的需求。
笔者以为在芯片需求还未成规划、深度学习算法暂未安稳需求不断迭代改善的状况下,运用具有可重构特性的FPGA芯片来完成半定制的人工智能芯片是最佳挑选。跟着人工智能算法和运用技能的日益开展,以及人工智能专用芯片ASIC工业环境的逐步老练,人工智能ASIC将成为人工智能核算芯片开展的必然趋势。