AI芯片大战格局解读:这场三国杀有点热闹

2017-05-15 15:56:49来源:亿欧网 热度:

谷歌的无人车在美国开了几十万公里,通过训练练出一个自动驾驶的AI模型。这个模型训练出来之后,未来可以部署到每一台量产的谷歌无人车,实现自动驾驶。在自动驾驶中,这个AI模型就必须实时进行推断。
 
英伟达Q1的财报发布后几小时,股价就暴涨14%。
 
老黄的Keynote还没讲完,英伟达市值就被推高20%,突破700亿美元。
 
华尔街疯狂的背后,是人工智能的大潮,与推动这一大潮的全新技术。
 
英伟达最新的GPU芯片——TeslaV100及其TensorCore,必将让这科技的大潮又起一层浪。
 
眼看着英伟达在这人工智能的浪潮中一骑绝尘,它的技术到底能有多厉害?难道其他芯片巨头就真的在吃干饭吗?
 
今天,我们特意邀请到两位芯片领域的专家,专门来聊聊英伟达的新技术,以及这场AI芯片大战的关键看点。
 
英伟达领先多少
 
昨天以前,英伟达在深度学习芯片领域已经非常领先了,但是还不是遥不可及。
 
但在一口气发布的7个产品和计划后,特别是其中的TeslaV100,确实震撼。可以说,大大拉开了它与竞争对手的距离。
 
这不由得让人想起90年代,思科成为互联网第一波红利的最大获益者。现在AI时代的到来,尽管我们还不知道它这一轮到底能冲多高,但大家都还在摩拳擦掌、买枪买炮。
 
而英伟达却第一时间成为一家独大的军火商,肯定是AI第一波红利的最大获益者。
 
英伟达在GTC大会推出的全新GPU,确实在技术上划了时代,吊打所有对手。
 
通用的GPU单元,专门的Tensor加速器,矩阵运算绝对性能爆炸,同时还兼顾其他算法。不愧是英伟达凭借多年在深度学习领域的积累、对需求深刻洞察之后推出的心血大作,比上一代强大十倍的性能,既适合训练又适合部署。
 
就此,老黄已直接对绝大多数做深度学习芯片的创业项目宣判了死刑。
 
为什么GPU就适合AI?
 
我们来科普一下。深度学习是机器学习的一种技术,基于深度神经网络,这一轮AI主要就是深度学习技术突破引领的。
 
而深度学习里面绝大多数的运算都是矩阵运算,矩阵运算天生就容易并行,而GPU最擅长的就是做并行数学计算,所以特别适合做深度学习。
 
2012年的时候,Geoffrey Hinton的学生Alex Krizhevsky用GPU来做深度学习,并且取得了ImageNet大赛冠军。经过他们的评测,用GPU比CPU快60倍。
 
人工智能研究者一找上GPU,英伟达立马抓住机会,短时间内动用数千工程师、投入20亿美元,研发出第一台专门为深度学习优化的Pascal GPU。所以,在深度学习大行其道的今天,英伟达就成了大赢家了。而深度学习中GPU的应用,有这两个场景:一个是训练,一个是部署。所谓训练,就是AI的构建过程,研究员在线下通过喂给AI算法大量的数据,产生出一个模型。而部署,就是把训练好的这个模型拿到应用现场去用,去做推断。
 
比如说,谷歌的无人车在美国开了几十万公里,通过训练练出一个自动驾驶的AI模型。这个模型训练出来之后,未来可以部署到每一台量产的谷歌无人车,实现自动驾驶。在自动驾驶中,这个AI模型就必须实时进行推断。
 
训练阶段,我们主要关心的是大规模的计算吞吐率,而到了部署中,更强调的是绝对的计算能力、低延迟、高性能功耗比、高稳定性。
 
现在在AI界,训练模型普遍采用英伟达的GPU,但是到了部署领域呢,有人用GPU,有人用谷歌的TPU,有人用英特尔,还有一大批嵌入式芯片开发商正在开发专用的前端深度学习芯片。
 
但是,刚刚发布的V100,既适合做训练,又适合做推断,除了功耗较大以外,在能力方面实现了左右通杀,所以确实厉害。
 
另外,英伟达还有一个专门用来部署的运行时环境叫TeslaRT。所以英伟达在AI芯片领域真有点一骑绝尘的架势了。
 
难道无人能挡英伟达?
 
AI芯片这么大的一块蛋糕,总得多有几个人来分才热闹,就算英伟达现在的优势不容置疑,那接下来的疑问就是,它的优势究竟能持续多久?
 
谷歌TPU
 
几天前,在谷歌TPU团队出走半数后,计算机体系架构的宗师DavidPatterson宣布他要加入谷歌,正式参与TPU项目。
 
上个月,谷歌关于TPU性能的论文披露说,TPU运行速度是英伟达和英特尔相关处理器的15-30倍,能效高出30-80倍。
 
谷歌的TPU适用于部署,能跟谷歌自家的TensorFlow紧密结合。可惜它是闭源的,谷歌视它为核心竞争力,应该不会开放给别人用。
 
TPU的第一版很惊艳,不过缺点也很多。现在从谷歌的论文来看,这个架构有点过时,实践当中也会有很大局限性。虽说这次DavidPatterson加入谷歌TPU团队的动静很大,但我们还是应当保持冷静、继续观察。
 
英特尔
 
另一个能跟英伟达叫板的,就是老牌芯片巨头英特尔,但它的CPU擅长高速处理数字,却不擅长处理音视频等非结构化数据。
 
于是在去年,英特尔耗资4亿美元收购深度学习初创企业Nervana,试图通过Nervana Systems在硅层实现机器学习。今年3月,这家土豪又怒砸153亿美元收购一家以色列芯片公司Mobileye,土豪要用自己家的高性能计算和网络连接能力,结合Mobileye的计算机视觉专业技术,打造从云端直达每辆汽车的无人驾驶解决方案,深化它在自动驾驶领域的布局。
 
收购Nervana,是英特尔非常厉害的一招。因为,这家公司前几年一直在帮英伟达优化GPU平台。他们是一群顶级黑客团队,hack了GPU的native指令集,写出了比当时的cudnn(NVIDIA自己的深度学习数学库)还要快若干倍的数学库。他们的成果都开源给了社区,cudnn后面的进步很大程度是因为吸收了这些成果。这家公司被英特尔收购后,就断了继续为英伟达提供服务的可能,同时也极大增强了英特尔的实力。
 
英特尔现在是allinAI,它的几大产品线,都会重点针对深度学习进行专门定制,比如之前作为HPC平台的XeonPhi加速计算卡,收购的AlteraFPGA,包括NervanaSystem,都是各自独立的深度学习产品线。其他还包括IoT部门,还有收购的Movidius公司,这些是提供嵌入式和端的解决方案。
 
这样来看,在深度学习芯片上,英伟达一马当先,英特尔黄雀在后,而谷歌的TPU,还真是任重而道远啊。

责任编辑:黄焱林

为您推荐

2009广电媒体:构建可持续发展新格局

2009年是新中国成立60周年,也是推进“十一五”规划顺利实施的关键性一年。8月,国务院出台《文化产业振兴规划》,首次对文化产业发展作出规划。在全行业应对全球金融危机,保持经济平稳较快发展的大格局下,作为文化产业主导力量的中国广电媒体,适时调整发展战略,努力增强抵御风险能力,寻求进一步做大做强的有效途径。广电产业呈现出制播分离改革、媒体资源竞争、广告营销创新、高新产业构建、新媒体业务融合的可持续性发展格局。体制机制变革:制播分离成产业发展突破口2009年8月,国家广电总局下发了《关于认真做好广播电视制播分离改革的意见》,这是首部专门针对制播分离改革发布的指导性政策文件。在政府管理部门的推动下,

携号转网今日实施 竞争格局开始偏移

携号转网在试点地区终于尘埃落定,中国通信行业向更全面的竞争迈出了关键性一步。经过近三年的筹备及近一年来试点地区的反复测验,工业和信息化部近日决定,将于2010年11月22日零时起,正式启动天津、海南本地网面向移动用户的号码携带试验,试验时间为6个月。号码所有权转移携号转网在试点地区试验的启动,意味着通信行业的最后一道篱笆墙被推倒了。从产业格局的角度来看,携号转网将有效促进竞争,改善市场竞争中一家独大的局面。记者采访的多位专家都表示,携号转网对成熟市场将起到积极作用。这样的市场已经相对饱和,运营商之间的竞争只存在于存量用户的争夺,这类似于现阶段的中国通信市场。而从用户的角度来看,未来,携号转网在

三网融合业务模式创新 催生市场新格局

实现三网融合之后,人们可用电视遥控器打电话,在手机上看电视剧,随需选择网络和终端,只要拉一条线、或无线接入即完成通信、电视、上网等。从去年开始,我国开始大力推动三网融合,并确定了12个试点城市。一年过去了,三网融合发展情况如何?有哪些新的趋势?去年7月,国家正式公布了三网融合试点城市名单,包括北京、上海、杭州在内的12个地区入选。试点一年,杭州已有超过100多万数字电视用户全部可以实现互动点播,深圳市则启动“甩信”实现了手机与电视的多屏互通业务,各个地区都在三网融合创新业务模式上取得了一定进展。业内分析人士指出,今年7月,在总结第一批试点经验的基础上,三网融合将进入发展的第二阶段。这期间,业务