第一个把AI芯片带进手机的华为今年算力要飞？-Ameya360 electronic components purchasing network

第一个把AI芯片带进手机的华为今年算力要飞？

Release time：2019-08-23

author：

source：techweb

reading：3721

看似高深的人工智能（AI）技术，其实已经“润物细无声”地深入大众生活，仅你手中一部华为Mate20手机，就可以实现人脸识别、物体识别、物体检测、图像分割、智能翻译等AI功能。这背后，依仗的是手机算力的大幅提升。其中小小一枚一分钱硬币大小的华为麒麟980手机芯片，就集成了69亿个晶体管，具备每秒钟完成万亿次级运算的能力。你可能想不到，如今自己手中任何普通智能手机的算力，甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更高。

数据、算力和算法，驱动着人工智能的第三次浪潮。其中，算力正是重要的基石。手机端的芯片算力几年间已经发展到如此惊人，用于云端的AI芯片需要处理自动驾驶等复杂场景的海量数据，又需要多强大的算力呢？ OpenAI近期发布的研究显示，仅2012年以来，人们对于算力的需求增长六年就超过 30万倍，平均每年增长10倍，远远超过了摩尔定律的发展速度，因为深度学习神经网络需要对张量（可以简化理解为矩阵）进行大规模并行计算，颠覆了传统的浮点计算，对算力的需求正在出现指数级的爆炸式增长。例如原来1个时钟单元只能计算1次浮点计算，现在可以通过新的算子同时对N*N的矩阵计算，如果N=10,那就是同时计算了100次，计算次数较原来增长了100倍，新算子带来了对新芯片的强大算力诉求。

如果说2019年最受舆论关注的ICT和智能终端厂商是华为，那么其去年10月以来一直“犹抱琵琶半遮面”的业界算力最高AI处理器——Ascend（昇腾）910芯片，则是人工智能圈本年度最期待的AI芯片。

面对 AI 算力需求的爆发式增长，这几年华为在做些什么？

率先将专用NPU AI芯片引入手机

人工智能发展中，我国在数据方面具备优势，但在算法与算力方面仍待发展，尤其是芯片与硬件代表的算力方面。算法科学家、工程师和应用厂商面临着AI算力稀缺和昂贵问题，大大抬高了算法研究和创新门槛，阻碍着AI的全行业普及和应用。

正因如此，尽管AI芯片在金钱、时间和人力各方面的研发成本高昂，但在AI商业赛道上，各厂商都在打造各自的芯片体系，其中多为聚焦于某一应用或某一场景的互联网和芯片厂商，也不乏ICT大厂。国内厂商中，华为在AI芯片的布局堪称“经典”。

在AlphaGo一战成名之前，绝大多国人就已经完成了从功能手机到第一代智能手机的换代，不断增长的手机系统自带功能特性和第三方应用，刷新着用户的体验。无论是AI功能还是场景化AI服务，都需要手机完成复杂深度学习算法模型运算，计算密集复杂，计算需求巨大，实时性非常挑战；同时运行环境受限，功耗、内存、存储空间非常挑战，因此强大的算力是必须的。

如何将人工智能引入到手机终端，是彼时苹果、华为在内的手机厂商都在努力攻破的问题。

2017年9月的柏林电子消费展上，华为正式向发布全球首款移动端AI芯片麒麟970，一个月后发布了搭载麒麟970的旗舰手机Mate 10。麒麟970是全球首款内置了独立神经网络处理单元（即NPU）的人工智能芯片。华为第一个将NPU引入手机芯片，在此之后，苹果、三星等厂商纷纷跟进，到今天，AI手机已成为众多手机厂商的旗舰配置。麒麟970内置NPU性能大幅优于CPU、GPU和DSP这些通用计算单元。同时相比CPU获得了约50倍能效和25倍性能优势。这意味着，麒麟970芯片可以用更少的能耗更快地完成AI计算任务。

第一个把AI芯片带进手机的华为今年算力要飞？

在NPU的加持下，手机功能也会变得更加强大。例如使用语音功能时，AI会对当前语境和内容进行细致的分析，从而实现高准确率的识别体验，将语音识别的成功率提升到更高的级别。这样一来，以智能助手为主语音功能就得以替代传统的手工输入，扮演更重要的角色，或许以后大街上见不到边玩边走“低头族”，而是更多人对着手机“自言自语”了。

在用户十分关心的拍照方面，AI的出现同样为喜欢手机摄影的用户带来不少福利。麒麟970搭载双通道ISP图像信号处理器，在动态影像捕捉和低光拍照上有很大的提升。双摄镜头+双ISP软硬件优化、再配合人工智能的计算机视觉分析，便能自动分析画面内的物体，并选择当前最佳的拍照模式，甚至可以进行物体追踪对焦和预测用户拍照时机，提供前所未有的拍照体验。

麒麟970的推出，成为传统智能手机和未来AI手机的重要分水岭，AI手机的发展也从单纯的算法优化进入了硬件能力的真·人工智能比拼阶段。

2018年8月，同样是在柏林电子消费展上，华为又发布了全球首款7nm人工智能手机芯片——麒麟980。

1纳米等于1毫微米（即十亿分之一米），约为10个原子的长度。一根头发丝直径约为0.1毫米，而7nm相当于头发丝的万分之一，在不到1平方厘米的麒麟980内部有高达69亿个晶体管。从芯片工艺上看，7nm相当于70个原子直径，逼近了硅基半导体工艺的物理极限，麒麟980实现了在针尖上翩翩起舞。华为消费者业务CEO余承东表示，麒麟980的7nm工艺是由超过1000多名半导体工程师组成的团队历时3年时间、经历超过5000多次的工程验证精心打磨的成果。

相对于麒麟970来说，麒麟980全面升级。以图像识别速度为例，麒麟970可达到约2005张每分钟，而麒麟980在移动端双NPU强大算力加持下，实现每分钟图像识别4500张，识别速度相比上一代提升120%，远高于业界同期水平。随之而来的，是人脸识别、语音助手、AI拍照，及各类智能美拍P图等APP在手机上的全面升级。

同时，面对更海量的用户，麒麟710让更多消费者享受到人工智能的乐趣。到了2019年，华为推出麒麟810芯片，这是华为第二款7nm工艺的手机芯片，也是华为首款自研达芬奇架构NPU的手机芯片，这意味着更多海量用户享受到专用NPU带来的旗舰级的AI体验。

至此，华为完成第一轮在手机端的AI芯片布局（麒麟970、麒麟980、麒麟710、麒麟810），手机产业也正式走入了AI时代。

“达芬奇”构建端边云算力大爆发基础

AI赛道比拼，影响的绝不仅是手机端，边缘侧、云侧的硬件算力、数据算法等元素无一不处于白热化的竞赛之中，几乎每天都有新的论文、新的产品问世。

如果说华为在芯片上的持续投入属“居安思危”，显示的是其远见与决心。那么，华为在人工智能领域的野心则更为宏大，这一次，华为不仅要覆盖云、边、端各种场景，还要形成从应用使能到系统到芯片的闭环。

2018年10月，华为在其全联接大会上首次提出全栈全场景 AI 解决方案，华为轮值董事长徐直军表示，“全场景，是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。全栈是技术功能视角，是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”

其中，全栈AI的基础，是一系列基于统一的达芬奇架构的AI芯片——从IoT到终端（如麒麟芯片的NPU）、到边缘侧再到云。在会上，徐直军还宣布，“外界一直在传华为在开发AI芯片，我要告诉大家，这是事实，我们今天发布两颗AI芯片：华为昇腾（Ascend）910和310。”此言一出，立刻在国内外人工智能圈子惊起波澜——华为终于祭出了大招。

第一个把AI芯片带进手机的华为今年算力要飞？

达芬奇架构针对AI运算特征而设计，以高性能3D Cube计算引擎为基础，实现了算力和能效的大幅提升。从云、边缘、端独立的和协同的AI实际需求出发，从极致低功耗，到极致大算力的AI场景，为云、边、端之间的算法协同、迁移、部署、升级和运维，提供了统一架构底层核心支撑，大大降低了人工智能算法开发和迭代的门槛，降低企业人工智能部署和商用成本。

目前，昇腾（Ascend）芯片家族中的昇腾310已经落地商用。基于昇腾310，华为陆续发布了包括Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品，已被广泛应用于安防、金融、医疗、交通、电力、汽车等行业，涉及摄像机、无人机、机器人、智能小站、MDC（Mobile Data Center）等产品形态。并提供基于昇腾310的AI云服务，比如华为云图像分析类服务、OCR服务、视频智能分析服务等超过50款API已经基于昇腾310，日均调用量超过1亿次。另有大量企业客户正在借助昇腾310芯片自己开发算法服务。

第一个把AI芯片带进手机的华为今年算力要飞？

随着昇腾310相关产品大规模上市，外界对昇腾910的期待更盛。毕竟，去年10月，徐直军在会上公布，“昇腾910是计算密度最大的单芯片，最大功耗为350W，半精度为（FP 16）256 Tera FLOPS，比英伟达 V100的125 Tera FLOPS还要高出近1倍。若集齐1024个昇腾910，将会出现迄今为止全球最大的AI计算集群，性能也将达到256个P，不管多复杂的模型都能轻松训练。”简单来说就是，昇腾910是业界算力最高的AI处理器，相同功耗情况下，它的算力是业界芯片的2倍，最强CPU的50倍。

全栈全场景AI逐步落地

除了昇腾系列芯片外，华为提出的全栈AI，还包括支持端、边、云独立的和协同的统一训练和推理框架MindSpore，芯片算子库和高度自动化算子开发工具——CANN,提供全流程服务（ModelArts）、分层API和预集成方案的应用使能。

其中，在2019年已经落地实现商用的，除了昇腾310，还有其面向用户和开发者的门户——华为云ModelArts。作为一站式AI开发平台，ModelArts可以提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成，及端-边-云模型按需部署能力，帮助用户快速创建和部署模型，管理全周期 AI 工作流。2019年5月，在斯坦福大学DAWNBench榜单，华为云ModelArts获得图像识别训练第一，ImageNet-1k数据集上用128块V100 GPU训练ResNet-50模型仅需要2分43秒，而在2017年10月，斯坦福DAWN的训练时间是13天10小时41分钟。斯坦福大学DAWNBench榜单几乎聚集了国内外领先AI厂商，ModelArts如果由强大的昇腾910加持，是否能进一步刷新世界纪录？若再采用1024个昇腾910的全球最大AI计算集群，又将出现什么样的成绩？

从端侧到边缘侧再到云侧，从底层硬件到深度学习框架再到上层应用使能，华为的全栈全场景AI战略正在逐步落地。在一年前关于AI的豪言中，哪些是华为下一步将要向市场兑现的呢？我们拭目以待。

（"Note: The information presented in this article is gathered from the internet and is provided as a reference for educational purposes. It does not signify the endorsement or standpoint of our website. If you find any content that violates copyright or intellectual property rights, please inform us for prompt removal."）

行业新闻

华为要求芯片产能移至中国，并暂缓新供应商验证

面对美方穷追不舍的禁令攻势，华为扩大本土化供应商队伍的布局节奏持续加快。据日经中文网消息显示，华为已经对供应商提出新的要求，希望芯片封装测试、芯片印刷基板供应商的相关生产在今年底以前完成大部分国产化，以增加供应链掌握力。与此同时，华为目前已经暂停验证新的供应商，除非他们愿意增加中国境内的产能或者配合在中国生产。这意味着华为未来的供应链策略是实现完全本土化。众所周知，目前半导体的前段制造工序大都分散在欧、日、韩和台湾地区。由于最新一轮的美国禁令以及全球经济放缓，欧、日、韩等供货商对于在中国扩增产能可能会产生迟疑，随意转移的可能性不大。但是华为一直希望封装测试等芯片加工的最后一道工序，以及后续的PCB制造可以尽量移至中国，这是相对可行的。其中一名消息来源表示，华为未来的供应链策略就是要本土化，以有中国产能的供货商为首要的策略伙伴。对此，华为方暂无正面回应。“这是本土科技企业的福音！”一位业内人士表示，“国内的相关企业应以此为契机，与华为、华为供应链积极开展合作，推进完整本土化产业链的发展，不让核心技术再次被卡脖子！”当然也有相对消极的声音。一位业内朋友表示，主要供应链放在中国不仅可以提高自己的抗风险能力，还可以增加国内的就业岗位，这是利好多方的。但由于中美贸易依旧不明朗，美系厂商介于政治压力下能否顺利与华为展开合作，又是另外一个命题了。更值得一提的是，针对“美国白宫对华为的封杀升级”，6月9日华为官方在推特上连发两则推文与美方“硬刚”！第一则推文称："美国的贸易保护主义将伤害美国公司。华为不会消失，公司在研发方面的支出约占总收入的15％——这几乎是爱立信与诺基亚总和的两倍——并（华为）将找到替代美国厂商并增加研发投资的方法，以确保更广泛的IP覆盖范围。”第二条推文则讽刺了美国在5G科技的落后：“是否需要证据表明民族主义在科技行业不起作用？5G技术的80％的专利由6家公司拥有——（其中）华为是领先者，只有1家是美国公司。所以？尽管（美方）为削减华为供应链做出了努力，但美国将继续为IP支付费用。"

2020-06-12 00:00 reading：2333

model	brand	Quote
MC33074DR2G	onsemi
BD71847AMWV-E2	ROHM Semiconductor
TL431ACLPR	Texas Instruments
CDZVT2R20B	ROHM Semiconductor
RB751G-40T2R	ROHM Semiconductor

model

brand

Quote

onsemi

ROHM Semiconductor

Texas Instruments

ROHM Semiconductor

ROHM Semiconductor

model	brand	To snap up
BU33JA2MNVX-CTL	ROHM Semiconductor
STM32F429IGT6	STMicroelectronics
IPZ40N04S5L4R8ATMA1	Infineon Technologies
BP3621	ROHM Semiconductor
ESR03EZPJ151	ROHM Semiconductor
TPS63050YFFR	Texas Instruments

model

brand

To snap up

BU33JA2MNVX-CTL

ROHM Semiconductor

STM32F429IGT6

STMicroelectronics

IPZ40N04S5L4R8ATMA1

Infineon Technologies

BP3621

ROHM Semiconductor

ESR03EZPJ151