芯片帝国架构：英伟达GPU独占风骚，英特尔掉队、谷歌奋力追赶

2018-09-01 08:52

CPU、GPU、FPGA、英特尔、英伟达、赛灵思等等随着深度学习带来的AI的兴起，芯片领域最近可谓是风起云涌，一个个科技名词走进公众视野，成为网红。AI创企也在不断吸金，用芯片燃烧着一个又一个神话；与此同时，老牌芯片厂商，英伟达、赛灵思也在不断被挑战的同时，续写自己的辉煌。

芯片，作为高端制造业的“皇冠明珠”，在不断变小、改变架构的同时，不断凝缩着新的科技结晶，逐渐构建出更庞大、更精致的科技帝国。

亿欧推出“芯片帝国”系列分析稿件，从芯片的核心架构、应用场景、国内外主要玩家和下游晶圆代工厂等方面呈现芯片业的产业图景。当前AI芯片主要分为GPU、FPGA、ASIC及类脑芯片等。以下为第一篇架构篇，从通用芯片CPU及它的创始者英特尔说起，梳理AI浪潮下不同的芯片架构，及它们所构筑的科技帝国。

英特尔和CPU：开山鼻祖，集成通用芯片、PC界老大

芯片中，最令人熟悉的恐怕是中央处理器CPU了。作为一种超大规模的集成通用芯片，CPU可完成多种不同种类的任务，在PC世界里起着大脑的作用。而CPU的诞生也开始了PC时代的巨头——英特尔的辉煌历史。

英特尔是主要以研制CPU处理器的巨头，全球最大的个人计算机零件和CPU制造商，1971年，英特尔推出了全球第一个微处理器，它引发的微处理器所带来的计算机和互联网革命，可以说改变了整个世界。

但CPU虽统治了PC时代，随着人工智能兴起，传统的CPU算力不足这一问题便越来越突出，尤其基于CPU的传统计算架构无法满足人工智能并行计算的需求。AI所需的深度学习需要很高的内在并行度、大量浮点计算能力以及矩阵运算，因此在通用芯片之下，需发展适合人工智能架构的专属芯片。这也带来了英特尔地位的下降。

不过在更早时候，即移动互联网大潮袭来时，CPU巨头英特尔的劣势就已开始显现了。英特尔在移动端不敌来自生产ARM芯片（与英特尔X86平级的CPU架构，但采用精简指令集计算机，主打低成本、低功耗和高效率）的ARM公司，目前世界超过95％的智能手机和平板电脑都采用ARM架构。

再加上英伟达GPU在数据中心业务的竞争，2010年还占据整个半导体芯片市场80％多份额（据IHS的报告数据）的英特尔，到2016年第二季度，仅占14．7％。

为了在人工智能时代不落后其他科技公司，英特尔近年来通过收购一批在FPGA、ASIC等芯片领域的头部企业。在云端，2015年，英特尔收购全球第二大FPGA厂商Altera；在终端，2016年收购了研发高性能视觉处理芯片的Movidius；另外，英特尔2017年还收购了汽车领域的Mobileye，以此对抗英特尔在汽车领域的地位。

不过，今年7月，英特尔交出的财报显示，其Q2营收为169．62亿美元，净利润50．06亿美元，同比增长78％。虽然营收、净利润增速不错，但基于CPU、FPGA的数据业务并未达到之前的预期，英特尔股价还是跌了。

当然，英伟达虽然目前已有颓势，但CPU却也没有到马上要被替代的地步。

CPU虽然计算能力稍差，但它是通用计算机的处理核心，处理各式各样的指令要求，所有部件也都要通过它互联互通，其有着复杂的逻辑控制单元和独特的指令翻译结构，这是其他芯片目前难以替代的。

并且，ARM架构的CPU芯片在手机和智能音箱等领域也是不可或缺的。所以唱衰CPU，还是为时过早的。

英伟达和GPU：先发制人的“十项全能”选手，目前应用最广泛AI芯片

CPU的计算能力渐渐落后，也催生了崛起的图像处理器GPU及新的巨头英伟达。1999年，英伟达发明了GPU，这极大地推动了PC游戏市场的发展，重新定义了现代计算机图形技术，并彻底改变了并行计算。

相比CPU，GPU由于更适合执行复杂的数学和几何计算（尤其是并行运算），刚好与包含大量的并行运算的人工智能深度学习算法相匹配，因此在人工智能时代刚好被赋予了新的使命，成为AI硬件首选，在云端作为AI“训练”的主力芯片，在终端的安防、汽车等领域，GPU也率先落地，是目前应用范围最广、灵活度最高的AI硬件。

而英伟达也因此几乎成为AI浪潮中的最大受益者，在加速深度学习算法芯片市场几乎占垄断地位。英伟达2016年第一个推出专为深度学习优化的Pascal GPU，2017年推出了性能更优的新GPU架构Volta，及神经网络推理加速器TensorRT 3。目前占据全球GPU行业的市场份额超过70％，GPU作为其核心产品占据84％的收入份额。

另外，由于英伟达发布的针对开发者提供的并行计算平台CUDA，被广泛认可和普及，积累了良好的编程环境，目前应用在人工智能领域，可进行通用计算的GPU市场基本被英伟达垄断。

不过英伟达在PC端和数据中心业务上，也面临着老二AMD的挑战。

在PC处理器市场，AMD正在英特尔主导的市场“抢食”。从2017年3月至今年4月，AMD推出了锐龙7、锐龙5、锐龙3、锐龙Threadripper、锐龙2000等处理器。数据显示，在锐龙处理器推出后，AMD的桌面处理器市场份额已从8％增至12％；而英特尔的份额则下跌1．9％，至87．8％。

虽然，英特尔在数据中心处理器市场也占有绝对的领先地位，拥有99％的市场份额，不过野村证券称英特尔正在试图阻止将15－20％的数据中心处理器份额让给AMD。

目前GPU和英伟达，在人工智能浪潮下，可以说是风头正劲，不过在顶着“应用最广泛AI芯片”的光环，英伟达也还面临FPGA和ASIC等专用化程度更高、计算力更强的芯片的挑战。

赛灵思和FPGA：“变形金刚”，算法未定型前的阶段性最佳选择

同样能满足更高的计算需求，并可进行编程，1984年，赛灵思（Xilinx）发明了现场可编程门阵列FPGA，FPGA作为半定制化的ASIC（专用集成电路），顺应了计算机需求更专业的趋势，成为神经网络算法中的主流芯片。

FPGA可算是芯片界的“变形金刚”，在写入软件前它有胜于CPU的通用性，写入软件后它有类似于ASIC的表现，是算法未定型前的阶段性最佳选择。FPGA相比GPU具有低功耗优势，同时相比ASIC具有开发周期快，更加灵活编程等特点。

在现阶段云端数据中心业务中，FPGA以其灵活性和可深度优化的特点，有望继GPU之后在该市场爆发；在目前的终端智能安防领域，也有厂商采用FPGA方案实现AI硬件加速。

FPGA市场的最大玩家是其创始者赛灵思，除了“通过系统集成和先进的‘软件定义’开发环境所扩展的新用户群体的服务”外，赛灵思在金融、制造业、娱乐、公共安全以及电信等传统行业，以及在自动驾驶汽车、无人机、智能监控等新兴行业都有布局。

在数据中心方面，全球七大超大规模云服务公司，已有3家采用了赛灵思FPGA，其中的百度于今年10月宣布，其已设计出赛灵思UltraScale?FPGA池。另外，赛灵思在车用电脑视觉处理市场占有率排名第二，仅次于Mobileye（2017年被英特尔收购），不过其与Mobileye间还存在着巨大差距。

赛灵思今年还收购了我国的人工智能创企深鉴科技，深鉴基于赛灵思的FPGA开发AI芯片，此前已和大华股份、东方网力等安防厂商展开合作，推出基于Xilinx FPGA的DPU产品。

除赛灵思以53％的份额（咨询公司Gartner2016年数据）占据FPGA市场头把交椅外，阿尔特拉（Altera）以36％的份额位居其后。2015年6月，阿尔特拉被英特尔以167亿美元的价格收购后，英特尔在其基础上成立了可编程事业部。今年4月，英特尔的FGPA被正式应用于主流的数据中心OEM厂商中，主要客户包括戴尔、富士通等。

不过老大赛灵思在回复如何看待阿尔特拉被英特尔收购时，傲娇的表示：“我们依旧是第一，只是尾巴丢了”。

但由于FPGA要保证编程的灵活性，电路上会有大量冗余，因此成本上不能像ASIC做到最优，工作频率也不能太高。因而，在ASIC还并不成熟，同时GPU功耗和成本较高的现阶段发展较好。

谷歌和ASIC：“专精职业选手”，专一决定效率，AI芯片未来

随着专用化需求的进一步发展，芯片界又诞生了ASIC。ASIC（Application Specific Integrated Circuit）即专用集成电路，本文中特指专门为AI应用设计、专属架构的处理器芯片。

近年来涌现的类似TPU、NPU、VPU、BPU等，本质上都属于ASIC。无论是从性能、面积、功耗等各方面，AISC都优于GPU和FPGA，长期来看，ASIC代表AI芯片的未来。

ASIC架构典型的代表，是谷歌的张量处理器TPU，其采用了脉动阵列的组织方式。2016年，谷歌TPU在AlphaGo与李世石一役中横空出世，使AlphaGo“思考”棋招和预判局势，处理速度比GPU和CPU快上几十倍。令人惊艳的的TPU，也一度被认为是AI芯片业内新的搅局者。不过TPU的资历也没比以上几位年轻，哈佛大学孔祥重教授在1970 s就提出了TPU的脉动阵列组织方式。

今年2月，谷歌也以Beta测试的形式开放了一直只是自用的TPU，服务的名称为Cloud TPUs（云端TPUs），用于云端服务器。今年5月Google云端芯还发布了TPU 3．0，8月谷歌又推出一款为边缘计算定制的Edge TPU。

不过TPU目前并不对外发售，并且要想进入更多市场，它的通用性仍需检验。但谷歌TPU的推出，以及测试版对中小企业的开放，还是会对英伟达带来一定威胁。

而ASIC芯片领域，也有一大批追赶者。以我国的初创企业而言，2017年9月，华为发售的AI芯片麒麟970上的NPU（属ASIC架构）集成了初创芯片企业寒武纪的1A处理器作为其核心人工智能处理单元。

2017年1月，地平线携手英特尔发布基于BPU（属ASIC架构）架构的最新高级辅助驾驶系统，12月，地平线机器人发布“旭日”和“征程”两款嵌入式AI芯片，面向智能驾驶和智能摄像头。

2016年，英特尔收购的视觉处理芯片企业Movidius，其研发的VPU也是ASIC芯片。

在AI算法尚处于蓬勃发展、快速迭代的今天，ASIC存在开发周期较长、需要底层硬件编程、灵活性较低等劣势，因此目前发展速度还不及GPU和FPGA。但长期来看，ASIC是AI芯片的未来。

IBM和类脑芯片：另辟蹊径，颠覆传统计算架构，仍在研发

另外，在传统架构之外，还有一类“不走寻常路”的芯片，这就是“类脑芯片”。“类脑芯片”颠覆传统计算架构，将数字处理器当作神经元，把内存作为突触，内存、CPU和通信部件完全集成在一起，采用模拟人脑神经元结构来提升计算能力。

“类脑芯片”以IBM TrueNorth芯片为代表，但由于技术和底层硬件的限制，其尚处于前期研发阶段，目前不具备大规模商业应用的可能性。从技术成熟度和商业可行性两个角度，使用AI专属硬件进行加速运算是今后五年及以上的市场主流。

我国初创企业西井科技也在研发类脑芯片，其宣称“芯片用电路模拟神经，成品有100亿规模的仿真神经元，可用于基因测序、模拟大脑放电等领域”。

不过，类脑芯片的商用并不乐观，西井目前也从研究类脑芯片转向自动驾驶领域。

总结：诸侯混战，同赛道纠缠，不同架构竞争

从CPU、GPU、FPGA，到ASIC及类脑芯片，从英特尔、英伟达、赛灵思、谷歌再到IBM，可以看出芯片业最近50年可谓风起云涌，而人工智能芯片的兴起只是最近的一次浪潮。

GPU、FPGA、ASIC及类脑芯片等可用于AI的芯片，也只是目前登场的芯片中的一小部分，其商用场景还未完全展开。而当前的AI芯片中，应用还是以GPU领先，FPGA可能成为下一个爆点，ASIC目前是被看好、但不成熟的新星。

再看芯片巨头的斗争，英特尔与ARM在CPU市场、英伟达和AMD在GPU市场、赛灵思和阿尔特拉在FPGA市场上，及谷歌和一些创企在ASIC市场的竞争……而在AI浪潮下引导的芯片革新上，英特尔与英伟达，赛灵思以及谷歌又在不同芯片架构及应用场景间进行斗争。

可以说这确实是一场“诸侯混战”，而身处变革中的每一个巨头，都不想在战争中先倒下。

本地收藏打印推荐给朋友

声明： 本文系OFweek根据授权转载自其它媒体或授权刊载，目的在于信息传递，并不代表本站赞同其观点和对其真实性负责，如有新闻稿件和图片作品的内容、版权以及其它问题的，请联系我们。

发表评论

共0条评论，0人参与

登录登录即可访问所有OFweek服务

用户名/邮箱/手机：
密码：
忘记密码？
用其他账号登录： QQ | 微信 | 新浪微博

请输入评论内容...

请输入评论/评论长度6~500个字

暂无评论

图片新闻