芯片帝国架构:英伟达GPU独占风骚,英特尔掉队、谷歌奋力追赶
CPU、GPU、FPGA、英特尔、英伟达、赛灵思等等随着深度学习带来的AI的兴起,芯片领域最近可谓是风起云涌,一个个科技名词走进公众视野,成为网红。AI创企也在不断吸金,用芯片燃烧着一个又一个神话;与此同时,老牌芯片厂商,英伟达、赛灵思也在不断被挑战的同时,续写自己的辉煌。
芯片,作为高端制造业的“皇冠明珠”,在不断变小、改变架构的同时,不断凝缩着新的科技结晶,逐渐构建出更庞大、更精致的科技帝国。
亿欧推出“芯片帝国”系列分析稿件,从芯片的核心架构、应用场景、国内外主要玩家和下游晶圆代工厂等方面呈现芯片业的产业图景。当前AI芯片主要分为GPU、FPGA、ASIC及类脑芯片等。以下为第一篇架构篇,从通用芯片CPU及它的创始者英特尔说起,梳理AI浪潮下不同的芯片架构,及它们所构筑的科技帝国。
英特尔和CPU:开山鼻祖,集成通用芯片、PC界老大
芯片中,最令人熟悉的恐怕是中央处理器CPU了。作为一种超大规模的集成通用芯片,CPU可完成多种不同种类的任务,在PC世界里起着大脑的作用。而CPU的诞生也开始了PC时代的巨头——英特尔的辉煌历史。
英特尔是主要以研制CPU处理器的巨头,全球最大的个人计算机零件和CPU制造商,1971年,英特尔推出了全球第一个微处理器,它引发的微处理器所带来的计算机和互联网革命,可以说改变了整个世界。
但CPU虽统治了PC时代,随着人工智能兴起,传统的CPU算力不足这一问题便越来越突出,尤其基于CPU的传统计算架构无法满足人工智能并行计算的需求。AI所需的深度学习需要很高的内在并行度、大量浮点计算能力以及矩阵运算,因此在通用芯片之下,需发展适合人工智能架构的专属芯片。这也带来了英特尔地位的下降。
不过在更早时候,即移动互联网大潮袭来时,CPU巨头英特尔的劣势就已开始显现了。英特尔在移动端不敌来自生产ARM芯片(与英特尔X86平级的CPU架构,但采用精简指令集计算机,主打低成本、低功耗和高效率)的ARM公司,目前世界超过95%的智能手机和平板电脑都采用ARM架构。
再加上英伟达GPU在数据中心业务的竞争,2010年还占据整个半导体芯片市场80%多份额(据IHS的报告数据)的英特尔,到2016年第二季度,仅占14.7%。
为了在人工智能时代不落后其他科技公司,英特尔近年来通过收购一批在FPGA、ASIC等芯片领域的头部企业。在云端,2015年,英特尔收购全球第二大FPGA厂商Altera;在终端,2016年收购了研发高性能视觉处理芯片的Movidius;另外,英特尔2017年还收购了汽车领域的Mobileye,以此对抗英特尔在汽车领域的地位。
不过,今年7月,英特尔交出的财报显示,其Q2营收为169.62亿美元,净利润50.06亿美元,同比增长78%。虽然营收、净利润增速不错,但基于CPU、FPGA的数据业务并未达到之前的预期,英特尔股价还是跌了。
当然,英伟达虽然目前已有颓势,但CPU却也没有到马上要被替代的地步。
CPU虽然计算能力稍差,但它是通用计算机的处理核心,处理各式各样的指令要求,所有部件也都要通过它互联互通,其有着复杂的逻辑控制单元和独特的指令翻译结构,这是其他芯片目前难以替代的。
并且,ARM架构的CPU芯片在手机和智能音箱等领域也是不可或缺的。所以唱衰CPU,还是为时过早的。
英伟达和GPU:先发制人的“十项全能”选手,目前应用最广泛AI芯片
CPU的计算能力渐渐落后,也催生了崛起的图像处理器GPU及新的巨头英伟达。1999年,英伟达发明了GPU,这极大地推动了PC游戏市场的发展,重新定义了现代计算机图形技术,并彻底改变了并行计算。
相比CPU,GPU由于更适合执行复杂的数学和几何计算(尤其是并行运算),刚好与包含大量的并行运算的人工智能深度学习算法相匹配,因此在人工智能时代刚好被赋予了新的使命,成为AI硬件首选,在云端作为AI“训练”的主力芯片,在终端的安防、汽车等领域,GPU也率先落地,是目前应用范围最广、灵活度最高的AI硬件。
而英伟达也因此几乎成为AI浪潮中的最大受益者,在加速深度学习算法芯片市场几乎占垄断地位。英伟达2016年第一个推出专为深度学习优化的Pascal GPU,2017年推出了性能更优的新GPU架构Volta,及神经网络推理加速器TensorRT 3。目前占据全球GPU行业的市场份额超过70%,GPU作为其核心产品占据84%的收入份额。
另外,由于英伟达发布的针对开发者提供的并行计算平台CUDA,被广泛认可和普及,积累了良好的编程环境,目前应用在人工智能领域,可进行通用计算的GPU市场基本被英伟达垄断。
不过英伟达在PC端和数据中心业务上,也面临着老二AMD的挑战。
在PC处理器市场,AMD正在英特尔主导的市场“抢食”。从2017年3月至今年4月,AMD推出了锐龙7、锐龙5、锐龙3、锐龙Threadripper、锐龙2000等处理器。数据显示,在锐龙处理器推出后,AMD的桌面处理器市场份额已从8%增至12%;而英特尔的份额则下跌1.9%,至87.8%。
虽然,英特尔在数据中心处理器市场也占有绝对的领先地位,拥有99%的市场份额,不过野村证券称英特尔正在试图阻止将15-20%的数据中心处理器份额让给AMD。
目前GPU和英伟达,在人工智能浪潮下,可以说是风头正劲,不过在顶着“应用最广泛AI芯片”的光环,英伟达也还面临FPGA和ASIC等专用化程度更高、计算力更强的芯片的挑战。
赛灵思和FPGA:“变形金刚”,算法未定型前的阶段性最佳选择
同样能满足更高的计算需求,并可进行编程,1984年,赛灵思(Xilinx)发明了现场可编程门阵列FPGA,FPGA作为半定制化的ASIC(专用集成电路),顺应了计算机需求更专业的趋势,成为神经网络算法中的主流芯片。
FPGA可算是芯片界的“变形金刚”,在写入软件前它有胜于CPU的通用性,写入软件后它有类似于ASIC的表现,是算法未定型前的阶段性最佳选择。FPGA相比GPU具有低功耗优势,同时相比ASIC具有开发周期快,更加灵活编程等特点。
在现阶段云端数据中心业务中,FPGA以其灵活性和可深度优化的特点,有望继GPU之后在该市场爆发;在目前的终端智能安防领域,也有厂商采用FPGA方案实现AI硬件加速。
FPGA市场的最大玩家是其创始者赛灵思,除了“通过系统集成和先进的‘软件定义’开发环境所扩展的新用户群体的服务”外,赛灵思在金融、制造业、娱乐、公共安全以及电信等传统行业,以及在自动驾驶汽车、无人机、智能监控等新兴行业都有布局。
在数据中心方面,全球七大超大规模云服务公司,已有3家采用了赛灵思FPGA,其中的百度于今年10月宣布,其已设计出赛灵思UltraScale?FPGA池。另外,赛灵思在车用电脑视觉处理市场占有率排名第二,仅次于Mobileye(2017年被英特尔收购),不过其与Mobileye间还存在着巨大差距。
赛灵思今年还收购了我国的人工智能创企深鉴科技,深鉴基于赛灵思的FPGA开发AI芯片,此前已和大华股份、东方网力等安防厂商展开合作,推出基于Xilinx FPGA的DPU产品。
除赛灵思以53%的份额(咨询公司Gartner2016年数据)占据FPGA市场头把交椅外,阿尔特拉(Altera)以36%的份额位居其后。2015年6月,阿尔特拉被英特尔以167亿美元的价格收购后,英特尔在其基础上成立了可编程事业部。今年4月,英特尔的FGPA被正式应用于主流的数据中心OEM厂商中,主要客户包括戴尔、富士通等。
不过老大赛灵思在回复如何看待阿尔特拉被英特尔收购时,傲娇的表示:“我们依旧是第一,只是尾巴丢了”。
但由于FPGA要保证编程的灵活性,电路上会有大量冗余,因此成本上不能像ASIC做到最优,工作频率也不能太高。因而,在ASIC还并不成熟,同时GPU功耗和成本较高的现阶段发展较好。
谷歌和ASIC:“专精职业选手”,专一决定效率,AI芯片未来
随着专用化需求的进一步发展,芯片界又诞生了ASIC。ASIC(Application Specific Integrated Circuit)即专用集成电路,本文中特指专门为AI应用设计、专属架构的处理器芯片。
近年来涌现的类似TPU、NPU、VPU、BPU等,本质上都属于ASIC。无论是从性能、面积、功耗等各方面,AISC都优于GPU和FPGA,长期来看,ASIC代表AI芯片的未来。
ASIC架构典型的代表,是谷歌的张量处理器TPU,其采用了脉动阵列的组织方式。2016年,谷歌TPU在AlphaGo与李世石一役中横空出世,使AlphaGo“思考”棋招和预判局势,处理速度比GPU和CPU快上几十倍。令人惊艳的的TPU,也一度被认为是AI芯片业内新的搅局者。不过TPU的资历也没比以上几位年轻,哈佛大学孔祥重教授在1970 s就提出了TPU的脉动阵列组织方式。
今年2月,谷歌也以Beta测试的形式开放了一直只是自用的TPU,服务的名称为Cloud TPUs(云端TPUs),用于云端服务器。今年5月Google云端芯还发布了TPU 3.0,8月谷歌又推出一款为边缘计算定制的Edge TPU。
不过TPU目前并不对外发售,并且要想进入更多市场,它的通用性仍需检验。但谷歌TPU的推出,以及测试版对中小企业的开放,还是会对英伟达带来一定威胁。
而ASIC芯片领域,也有一大批追赶者。以我国的初创企业而言,2017年9月,华为发售的AI芯片麒麟970上的NPU(属ASIC架构)集成了初创芯片企业寒武纪的1A处理器作为其核心人工智能处理单元。
2017年1月,地平线携手英特尔发布基于BPU(属ASIC架构)架构的最新高级辅助驾驶系统,12月,地平线机器人发布“旭日”和“征程”两款嵌入式AI芯片,面向智能驾驶和智能摄像头。
2016年,英特尔收购的视觉处理芯片企业Movidius,其研发的VPU也是ASIC芯片。
在AI算法尚处于蓬勃发展、快速迭代的今天,ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势,因此目前发展速度还不及GPU和FPGA。但长期来看,ASIC是AI芯片的未来。
IBM和类脑芯片:另辟蹊径,颠覆传统计算架构,仍在研发
另外,在传统架构之外,还有一类“不走寻常路”的芯片,这就是“类脑芯片”。“类脑芯片”颠覆传统计算架构,将数字处理器当作神经元,把内存作为突触,内存、CPU和通信部件完全集成在一起,采用模拟人脑神经元结构来提升计算能力。
“类脑芯片”以IBM TrueNorth芯片为代表,但由于技术和底层硬件的限制,其尚处于前期研发阶段,目前不具备大规模商业应用的可能性。从技术成熟度和商业可行性两个角度,使用AI专属硬件进行加速运算是今后五年及以上的市场主流。
我国初创企业西井科技也在研发类脑芯片,其宣称“芯片用电路模拟神经,成品有100亿规模的仿真神经元,可用于基因测序、模拟大脑放电等领域”。
不过,类脑芯片的商用并不乐观,西井目前也从研究类脑芯片转向自动驾驶领域。
总结:诸侯混战,同赛道纠缠,不同架构竞争
从CPU、GPU、FPGA,到ASIC及类脑芯片,从英特尔、英伟达、赛灵思、谷歌再到IBM,可以看出芯片业最近50年可谓风起云涌,而人工智能芯片的兴起只是最近的一次浪潮。
GPU、FPGA、ASIC及类脑芯片等可用于AI的芯片,也只是目前登场的芯片中的一小部分,其商用场景还未完全展开。而当前的AI芯片中,应用还是以GPU领先,FPGA可能成为下一个爆点,ASIC目前是被看好、但不成熟的新星。
再看芯片巨头的斗争,英特尔与ARM在CPU市场、英伟达和AMD在GPU市场、赛灵思和阿尔特拉在FPGA市场上,及谷歌和一些创企在ASIC市场的竞争……而在AI浪潮下引导的芯片革新上,英特尔与英伟达,赛灵思以及谷歌又在不同芯片架构及应用场景间进行斗争。
可以说这确实是一场“诸侯混战”,而身处变革中的每一个巨头,都不想在战争中先倒下。
最新活动更多
-
精彩回顾立即查看>> 2024(第五届)全球数字经济产业大会暨展览会
-
精彩回顾立即查看>> 康耐视-基于Al和计算成像技术直播活动
-
精彩回顾立即查看>> 【汉高直播】导热类材料在电源及储能行业的应用
-
精彩回顾立即查看>> 【干货!】金升阳国产电源
-
精彩回顾立即查看>> 太阳能光伏组件创新技术在线峰会
-
精彩回顾立即查看>> 【在线研讨会】红外高温仪在光伏材料制备领域的应用
发表评论
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论