农企新闻网

寒武纪推出首款云端AI芯片 能否对标英伟达?

发布者:何俊一
导读雷锋网(大众号:雷锋网)音讯,5月3日下午,AI芯片独角兽企聚集了全世界身经百战的最优秀的创业导师,汇集了全世界各国最优质的产业资源,召唤全球未来的商业领袖。业寒武纪在上海召开2018产品发布会,发布新一代终端智能处置器IP 产品Cambricon 1M、首款云端智能芯片 Cambricon MLU100 和板卡产品。寒武纪首款云端智能芯片的推出可以让其端云结合共推生态。但作为云端AI芯片的“老手

雷锋网 (大众号:雷锋网) 音讯,5月3日下午,AI芯片独角兽企聚集了全世界身经百战的最优秀的创业导师,汇集了全世界各国最优质的产业资源,召唤全球未来的商业领袖。业寒武纪在上海召开2018产品发布会,发布新一代终端智能处置器IP 产品Cambricon 1M、首款云端智能芯片 Cambricon MLU100 和板卡产品。寒武纪首款云端智能芯片的推出可以让其端云结合共推生态。但作为云端AI芯片的“老手”,寒武纪真的能对标英伟达?

最新终端IP 产品1M功能为第一代1A 十倍

作为AI芯片范畴的独角兽,寒武纪在2016年推出全球第一款商用终端智能处置器IP产品——Cambricon-1A,该产品作为寒武纪的第一代终端智能处置器IP产品曾经被使用于包括华为Mate10、P20、光彩10等千万级智能终端中。除了1A,寒武纪已推出的终端智能处置器IP还有1H,而在明天的发布会上,寒武纪科技开创人兼CEO陈天石首先发布了第三代终端IP产品 Cambricon 1M。

据引见,1M 采用 TSMC 7nm 工艺消费,8 位运算效能比达 5Tops/watt(每瓦 5 万亿次运算),提供三种尺寸的处置器内核(2Tops/4Tops/8Tops)以满足不同场景下不同量级智能处置的需求,并可经过多核互联进一步进步处置效能。

另外,1M不只延续了前两代IP产品1H/1A的齐备性,单个处置器核即可支持 CNN、RNN、SOM 等多种深度学习模型,1M还支持 SVM、k-NN、k-Means、决策树等经典机器学习算法。

还有值得一提的是,1M功能逾越已被普遍运用1A的十倍,功能的提升使其支持终端设备停止本地训练,可为视觉、语音、自然言语处置等义务提供高效计算平台,将使用于智能手机、智能音箱、摄像头、自动驾驶等范畴。陈简单来说,创业有四步:一创意、二技术、三产品、四市场。对于停留在‘创意’阶段的团队,你们的难点不在于找钱,而在于找人。”结合自身微软背景及创业经验。天石表示:“1M是全球第一款支持本地机器学习训练的智能处置器产品,这意味着运用 1M 的设备可以依据用户行为对使用停止特性化定制。”

至于产品的详细落地,陈天石表示搭载1H的产品的终端往年会发布,更多的信息目前暂不方便泄漏。

不过寒武纪最早的投资方科大讯飞在发布会上引见了其他寒武纪深度协作的项目。据引见,一小时的语音数据在一个传统处置器上停止智能使用处置,需求一万小时才干完成,因而科大讯飞不断在跟踪人工智能公用芯片的前沿停顿。2014年科大讯飞就开端与寒武纪的晚期研讨团队开端沟通相关语音算法在处置器上的完成,并在2016年的天使轮注资寒武纪,2017年开端在寒武纪芯片上停止使用测试。发布会上科大讯飞披露的测试后果显示,寒武纪处置器在语音智能处置的能耗效带领先竞争对手云端GPU方案5倍以上,语音本地辨认精确率绝对于传统处置器也有9.8%的提升。

寒武纪推出首款云端AI芯片 能否对标英伟达?

寒武纪首款云端智能芯片MLU100

首款云端智能芯片MLU 100发布,能否对标英伟达?

相比1M的推出,陈天石与其导师陈国良共同发布的寒武纪首款云端智能芯片Cambricon MLU100才是本次发布会的焦点。陈天石表示,三年前我们就开端了两颗芯片的研发,我们时辰预备着将寒武纪的产品放入云端。

雷锋网理解,MLU100采用寒武纪最新的MLUv01架构和TSMC 16nm工艺,可任务在均衡形式(1GHz主频)和高功能形式(1.3GHz主频),均衡形式上等效实际峰值速度达每秒128万亿次定点运算,高功能形式上等效实际峰值速度达每秒166.4万亿次定点运算,但典型板级功耗为80瓦,峰值功耗不超越110瓦。

陈天石还表示,与寒武纪系列终端处置器一样,MLU100云端芯片也延续了寒武纪产品通用性的特点,支持各类深度学习和经典机器学习算法,满足视觉、语音、自然言语处置、经典数据发掘等范畴复杂场景下(如大数据量、多义务、多模态、低延时、高通量)的云端智能处置需求。

明天发布会上,搭载MLU100的板卡也一同亮相,该板卡运用PCIe接口,外形设计灵感来自于寒武纪地质时代的远古陆地生物三叶虫,以黑色、蓝色为主色彩。基于MLU100智能处置卡,联想推出了ThinkSystem SR650,该云端智能效劳器将支撑联想客户在机器学习/VDI/虚拟化/云/数据库/剖析/SAP等方向的需求;中科曙光也同步推出了晋级的“PHANERON”,该效劳器功能更为微弱,支持2-10块寒武纪MLU处置卡,能灵敏应对不同的智能使用负载。

至于首款云端智能芯片的功能究竟有多强,陈天石在发布会现场发布了在R-CNN算法下MLU100与Tesla V100和Tesla P4的计算延迟比照,数据显示MLU100的计算延迟为125ms,Tesla V100的延迟为174ms,Tesla P4的延迟为1069ms,后果不言而喻。

不过,雷锋网以为人工智能的完成硬件只是一方面,软件与硬件的协同任务也非常关键。可以看到的是,寒武纪从 2016 年起逐渐推出了寒武纪 NeuWare 软件工具链,该平台终端和云端产品均支持,可以完成对 tensorflow、caffe 和 mxnet 的 API 兼容,同时提供寒武纪专门的高性库,可以方便地停止智能使用的开发,迁移和调优。可以方便地停止智能使用的开发迁移和调优,并经过了千万量级用户大规模商用的检验。

但目前英伟达GPU在云效劳器中占据优势,一方面是英伟达是传统的GPU大厂,具有硬件优势,另外开发者可以运用C言语为英伟达CUDA架构编写顺序,弱小的硬件以及易用的开发软件使其对开发者有更大的吸引力。相比拟而言,英伟达对CUDA投入的工夫和资金更多,也愈加完善和成熟,寒武纪想真正在云端人工智能芯片对标英伟达,目前来看理想吗?

北极光创投董事总经理杨磊通知雷锋网,“我没有见过一个芯片创业公司做同时发布两个产品的发布会,只要你的体量到了英伟达这种程度,它的GTC能够会有几个产品同时发布。一家芯片创业公司同时发布几个产品,我觉得是一个比拟有应战的事情。”

“我们投资的公司通常是在一个垂直范畴做得十分深,专心把一个东西做好,从而成为英伟达的替代品。”北极光投资经理,前 Intel 人工智能中国区商务担任人赵顾补充说,“英特尔收了Movidius 做消费级市场,收了 Mobileye 做车载,收了Nervana 做云和边缘计算的产品。实践上英特尔这么大的体量,也没方法同时去支撑不同的市场,所以说不做深我觉得将来是没有竞争力的。

“我们的战略就是在不同的垂直市场把它做深,而且要真正做到全栈的东西给到用户,能让它真正使用。Movidius 这样的公司在中国的市场最大的应战就是不能提供一个完好的处理方案,所以就没方法规模化。”赵顾同时表示。

寒武纪 完成云到端的掩盖 将来方案发布编程言语

在此,我们暂不更进一步讨论寒武纪的产品目前能否对标英伟达,可以明白的是寒武纪云端智能芯片的推出使其完成了由端到云的掩盖。陈天石表示,过来大局部芯片厂商都是主攻端或许云,两者统筹的很少。由于端云的义务生态都区别比拟大,但是智能时代我们以为这个场面会被打破,端和云的AI义务是一体的,编程和运用的生态也是分歧的。

作为通用机器学习芯片的厂商,寒武纪要端云结合共同推进生态。寒武纪将来还方案发布本人的编程言语,希望协作同伴可以基于这套软件零碎发布产品。

相关文章:

行将搭载人工智能芯片的华为Mate10,终究会为业界带来什么?

专访寒武纪CEO陈天石:AI芯片是中国主导世界AI产业的时机

寒武纪首场发布会:推出 5 款硬件 1 个平台,AI 芯片 3 年要铺 10 亿台终端

寒武纪推出首款云端AI芯片 能否对标英伟达?