自从美国针对中国用户列出“实体名单”以来,全球半导体市场就动荡不安,各大调查机构纷纷下调半导体市场的全年营收,在 2019 Arm 技术峰会上,Arm 中国董事长兼首席执行官吴雄昂在演讲中表示,经过法务严禁调查,无论 Arm v8 还是 Arm v9 架构都是源自英国的技术,Arm 会和过去一样持续向中国伙伴进行授权和服务支持。这一消息给采用 Arm IP 设计芯片的中国公司吃下一颗“定心丸”。
吴雄昂还表示,目前,Arm 在中国有超过 200 个合作伙伴,中国客户基于 Arm 技术的芯片累计出货量超过 160 亿颗,其中 95%的国产 SoC 都是基于 Arm 处理器技术进行设计。吴雄昂强调,Arm 是唯一非美国的主流计算平台。
在本次峰会上,Arm 推出了两款全新的主流 ML 处理器 Ethos-N57 和 Ethos-N37 NPUs,以及最新的 Mali-G57 GPU 和 Mali-D37 DPU。Arm 市场营销副总裁 Ian Smythe 介绍,Ethos-N57 and Ethos-N37 NPUs 让 AI 应用成为可能并在 ML 的性能与成本、面积、带宽与电池寿命之间达成平衡;Mali-G57 GPU 是第一款基于 Valhall 架构的主流 GPU,可透过性能提升带来沉浸式体验; Mali-D37 DPU 以最小的芯片面积达成丰富的显示功能,成为入门设备与小型显示屏幕最适合的显示处理器(DPU)。
推出 Ethos 系列 NPU,加强 AI 能力
随着物联网的深入发展,AIoT 时代已经到来,小到手机、手表,大到家用电器,智能无处不在,但要促成这些响应式体验,端点必须具备更强的计算能力。例如,数字电视的智能体验,包括智能助理语音指令、节目实时翻译,以及人脸辨识以强化家长监护。
在原有 Ethos-N77 的基础上,Arm 又发布了 Ethos-N57 和 Ethos-N37 NPUs。其中,Ethos-N77 针对高端市场,Ethos-N57 针对主流市场,Ethos-N37 针对低端市场。 Arm Ethos 产品组合旨在解决 AI 与 ML 复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的 ML 处理器提供额外的 AI 性能与效率,是非常有必要的。全新的 Ethos 对成本与电池寿命最为敏感的设计进行优化,NPU 可以为日常生活设备带来优质的 AI 体验。
Ian Smythe 介绍,Ethos-N57 与 Ethos-N37 的设计理念包括一些基本原则,针对 Int8 与 Int16 数据类型的支持性进行优化;先进的数据管理技术,以减少数据的移动与相关的耗电;通过如创新的 Winograd 技术的落地,使性能比其他 NPU 提升超过 200% 。另外,Ethos-N37 的功能还包括为了提供面积最小的 ML 推论处理器(小于 1 平方毫米)而设计,针对每秒 1 兆次运算次数的性能范围进行优化;Ethos-N57 的功能还包括旨在提供平衡的 ML 性能与功耗效率,针对每秒 2 兆次运算次数的性能范围进行优化。
专用 AI 处理器和通用处理器之争
随着终端设备开始增加 AI 功能,不同的设备对 AI 的算力需求也不尽相同,有人认为原有的 CPU、GPU 通用架构芯片难以满足所有产品的需求,AI 专用芯片在计算密度和功耗上更有优势,因此有些公司在自己的 SoC 中加入了针对 AI 计算的 NPU 内核,比如华为麒麟 970 加入了 NPU 单元,苹果 A11 处理器也集成了 NPU 内核,还有一些公司开始设计 AI 专用芯片,比如地平线、云知声、出门问问、比特大陆等公司均推出了 AI 专用芯片。
Arm 推出 NPU 产品产品是否也是顺应这一市场需求?AI 专用芯片是否更适合 AI 算法?Ian Smythe 给出了不太一样的答案,他认为,在当前的市场环境下选择通用处理器比较合适,因为 AI 处理器还处于发展初级阶段,很多 AI 算法还处于迭代过程中,通用处理器还有 2-3 年的生命周期。而且 Arm 的优势在于,NPU 可以和 CPU、GPU 协同工作,实现异构 AI 计算,进一步提升整个系统层级的 AI 性能、降低功耗。
当记者问到 Arm 的 NPU 是否能够用于 RISC-V 架构时,Ian Smythe 表示,可以。但是他又解释,Arm 的 NPU 和自己的 CPU、GPU 协同工作,可以发挥最高的性能,如果和其它 CPU、GPU 组合性能的发挥无法得到保证。
Mali-G57 GPU:性能、能效双提升
对于 GPU 来讲,性能和能效是设备端最关注的两大指标,Mali-G57 GPU 将优质的智能与沉浸式体验带到主流市场,与 Mali-G52 相比,各种内容都能达到 1.3 倍的性能密度,能效比提升 30%,使电池寿命更长;针对虚拟现实(VR)提供注视点渲染支持,且设备 ML 性能提升 60%,以便进行更复杂的 XR 实境应用。
应用包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV 的 4K/8K 用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而 Arm 最近与 Unity 的发布强调其基于 Arm IP 的片上系统(SoC),CPU, GPU 进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。
Arm 曾经许诺,GPU 的能效会以 30%的速度提高,从 Mali-G57 的参数来看已经实现今年的目标,但是未来会是否持续以这样的速度提高能效?Ian Smythe 从两方面进行了解释,第一,Arm 一直关注能效,有工程师专门关注能效的提升;第二,计算分不同层次,为了达到同样的效果,Arm 会探索其它方式,从系统角度做各种提升。
Mali-D37 DPU:实现单位面积效率最高
Mali-D37 是一个在最小的可能面积上包含丰富显示与性能的 DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在 2k 以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
Mali-D37 的单位面积效率极高,DPU 在支持全高清(Full HD)与 2K 分辨率的组态下,16 纳米制程的面积将小于 1 mm2;通过减少 GPU 核心显示工作以及包括 MMU-600 等内存管理功能,系统电力最高可节省 30%;从高阶的 Mali-D71 保留关键的显示功能,包括与 Assertive Display 5 结合使用后,可混合显示高动态对比(HDR)与标准动态对比(SDR)的合成内容。
关于 Mali-D37 的省电方式,Ian Smythe 强调,从 Arm 的文化来看,我们更愿意从系统级别出发,降低整体能耗。
在线留言询价
型号 | 品牌 | 询价 |
---|---|---|
MC33074DR2G | onsemi | |
CDZVT2R20B | ROHM Semiconductor | |
RB751G-40T2R | ROHM Semiconductor | |
BD71847AMWV-E2 | ROHM Semiconductor | |
TL431ACLPR | Texas Instruments |
型号 | 品牌 | 抢购 |
---|---|---|
IPZ40N04S5L4R8ATMA1 | Infineon Technologies | |
BU33JA2MNVX-CTL | ROHM Semiconductor | |
ESR03EZPJ151 | ROHM Semiconductor | |
TPS63050YFFR | Texas Instruments | |
BP3621 | ROHM Semiconductor | |
STM32F429IGT6 | STMicroelectronics |
AMEYA360公众号二维码
识别二维码,即可关注