芯讯通:高<span style='color:red'>算力</span>智能模组SIM9650L助力AI智慧步道!
  8月8日是第16个全民健身日,今年的主题是“全民健身与奥运同行”。体育是国家实力的象征,是国民健康程度的标尺,它既是奥运精神的承载者,也是构筑国民健康生活的基石。  随着5G、AI、大数据的发展,科技和数字化对体育带来持续的变革和赋能,也成为推动体育产业发展的动力。作为物联网通信模组领域的领军企业,今天和大家聊一聊,物联网如何为实现全民健康的体育事业注入新的活力?  AI智慧步道  在全民健身和数字中国的战略背景下,智慧化全民健身基础设施成为许多城市的标配,你有没有留意到有的城市公园步道已经悄悄变得更“智慧”?  融入物联网、人脸识别、空间模型算法等智能技术,在城市公园和校园里打造智能化的AI智慧步道,由传感器、数据分析模块、智能推荐系统、用户界面和云平台构成,芯讯通高算力智能模组SIM9650L可以成为智慧步道系统的关键力量。  有了智慧步道系统,用户可以通过手机实时查看自己的数据以及正在跑步的用户排行榜。在智慧步道的路面通过安装搭载SIM9650L的传感器,采集跑步者的运动数据,比如跑步速度、步幅、心率等,进行分析、处理和输出。内置SIM9650L的智能采集杆将会自动计算这些运动数据,同步到步道智慧大屏和用户手机。  高算力智能模组SIM9650L搭载Android 14操作系统,采用高通6nm工艺的8核ARM V8处理器,主频可达2.7Ghz,内置Adreno™ 643 GPU,支持OpenGL、OpenCL等图形处理标准。其搭载强大的图像信号处理器,支持双屏异显,编码能力达4K、60帧/秒,在图像处理和视频分析方面表现出色。  SIM9650L的算力超过14Tops,内置的AI处理器Dual HVX和Hexagon Tensor Accelerator,让智慧步道系统拥有实时处理和分析海量数据的能力。该模块支持WiFi 6E和BT 5.2,提供高速、低延迟的局域网通信以及低功耗的蓝牙连接,支持设备间的近距离数据传输,增强步道周边设备之间的互联性。  同时,SIM9650L拥有丰富的接口,方便客户集成到智慧步道系统,与各种传感器、显示屏、摄像头无缝对接。SIM9650L凭借其强大的无线通信、短距离通信、卫星定位接收功能以及丰富的接口和人机界面支持,在智慧步道系统中具有强大优势,能够提升系统的智能化水平和运行效率。  伴随5G、AI、大数据等技术的持续演进,物联网在体育运动中的应用将更加广泛而深入。从智能穿戴设备到大型运动场馆,从日常健身锻炼到国际赛事组织,物联网将无处不在,为体育产业的每一个环节带来智能化、个性化的变革。芯讯通作为物联网技术的推动者,将携手行业伙伴,不断探索智慧体育、智慧城市的无限可能,为全民健康事业贡献更多智慧与力量。
关键词:
发布时间:2024-08-09 09:28 阅读量:461 继续阅读>>
刷新AI PC NPU<span style='color:red'>算力</span>,AMD锐龙AI 9 HX 375领衔55 TOPS
  最近AMD官网上线了锐龙AI 300系列中的最新成员锐龙AI 9 HX 375处理器。原本Ryzen AI 9 HX 370的NPU达到了50 TOPS,属于AI PC NPU性能第一梯队。而此次推出的Ryzen AI 9 HX 375算力进一步提升至55 TOPS。在NPU算力这条路上AMD甚是积极。  AMD Ryzen AI 9 HX 375性能  AMD Ryzen AI 9 HX 375采用TSMC 4nm FinFET制程工艺,CPU为12核心设计,包括4x Zen 5 , 8x Zen 5c,共24线程。其基准时钟频率为2 GHz,最高加速频率可达5.1 GHz。配备L2 高速缓存达12 MB,L3 高速缓存达24 MB。默认热设计功耗 (TDP)为28W,AMD 可配置热设计功耗 (cTDP)为15-54W。支持AMD EXPO内存超频技术。  来源:AMD官网       连接方面,支持PCIe 4.0,16条通道,最高内存速度4x2R DDR5-5600, LPDDR5x-7500,最大内存达256 GB。Ryzen AI 9 HX 375集成AMD Radeon 890M GPU,显卡核心数为16个,显卡频率高达2900 MHz。据悉,惠普即将推出的OmniBook Ultra笔记本将搭载这款处理器,为用户提供前所未有的AI体验和性能表现。  NPU算力之争  Ryzen AI 9 HX 375与Ryzen AI 9 HX 370最大的区别在于NPU算力,前者实现了55 TOPS算力,比后者的50 TOPS算力高10%。  来源:AMD官网       我们知道,微软给出的AI PC定义,NPU的算力至少要达到40 TOPS。这一定义的抛出,突显了NPU的重要性。同时CPU+GPU+NPU的组合将是AI PC的算力基座。其中,NPU提供高效能和低功耗的神经网络运算支持,在多种应用场景中实现智能计算。       在各大处理器厂商推出的AI PC处理器上都十分注重NPU算力的搭配。在笔者早前报道中统计过,英特尔酷睿Ultra产品系列中,2024年推出的Lunar Lake采用台积电3nm工艺,NPU性能将是上一代的4倍,达到48 TOPS。高通骁龙(Snapdragon)X Elite芯片搭载的全新 Hexagon NPU 最高可提供45 TOPS。而Ryzen AI 9 HX 370 更是达到50 TOPS的NPU算力。       如今Ryzen AI 9 HX 375的发布又将算力直接拉升到55 TOPS。AMD的锐龙 AI 300 系列从命名上就可以看出主打AI的鲜明特性,它全面支持 Copilot+ PC,实现在笔记本电脑上直接使用 Microsoft Copilot 等新应用程序和助手进行人工智能计算。  不过,根据此前英特尔公开的信息,Lunar Lake使用Lion Cove架构P-Core与Skymont架构E-Core,最多4P+4E;采用代号为Battlemage的Xe2架构核显;最多8个Xe2内核,搭载了最新的第四代NPU,可提供48 TOPS的算力,是上代的四倍多,平台整体算力则高达120 TOPS。可以看到,若是看CPU、GPU、NPU的平台整体算力,英特尔以120 TOPS的表现领先。       Canalys的最新预测数据显示,‌2024年全球AI PC出货量将达到4800万台,‌占个人电脑(PC)总出货量的18%。‌‌预计到2025年,‌AI PC出货量将超过1亿台,‌占PC总出货量的40%。‌到2028年,‌AI PC出货量预计将达到2.05亿台,‌2024年至2028年期间的复合年增长率(CAGR)将达到44%。Canalys指出,这些PC集成了专用于AI的加速器,如神经处理单元(NPU),将释放出高生产力、个性化及能效方面的新功能,为厂商及其合作伙伴带来显著的价值收益。
关键词:
发布时间:2024-08-07 09:14 阅读量:784 继续阅读>>
广和通发布基于高通高<span style='color:red'>算力</span>芯片的具身智能机器人开发平台Fibot
  3月29日,为助力机器人厂商客户快速复现及验证斯坦福Mobile ALOHA机器人的相关算法,广和通发布具身智能机器人开发平台Fibot。作为首款国产Mobile ALOHA机器人的升级配置版本,开发平台采用全向轮底盘设计、可拆卸式训练臂结构,赋予机械臂更多的自由度及臂展范围,并实现了Andorid/Linux融合系统,方便客户进行软件及算法的开发及验证。  “具身智能未来是AI边缘侧部署的关键应用,将大大提高人类生活和工作的效率与质量”,广和通AIC产品管理部总经理张泫舜表示:“广和通具身智能机器人开发平台Fibot具备感知、视觉、定位及导航、动作控制等底层能力,能更好地赋能客户实现AI与机器人相结合。随着AI技术的突破性进展,具身智能的演进将成为科技变革的新高地与经济发展的加速器。”  广和通具身智能机器人开发平台Fibot满足客户验证Mobile ALOHA协同学习与简单的示教操作数据需求,从而习得机械臂的高级移动操作功能算法。同时,开发平台还能通过底盘选配的激光雷达或双目模组,实现室内外的空间感知及建图、路径规划和动态避障等算法的二次开发。此开发平台还集成了多种深度学习和强化学习AI算法,结合高效的感知系统与智能决策框架,极大提升了客户进行二次开发的效率。值得一提的是,Fibot以广和通高算力智能模组SC171作为主控。SC171基于高通®QCM6490物联网解决方案设计,QCM6490采用8核高性能处理器,具备高达12TOPS算力,可对数据进行高效计算与处理;集成多种AI算法,助力终端实现边缘计算和AI特性。  高通公司产品市场总监李骏捷表示:“高通与广和通在AIoT领域保持着长期紧密的合作,此次利用高通先进的高性能低功耗物联网解决方案,支持广和通打造全新的具身智能机器人开发平台,彰显了双方积极践行推动终端侧AI与边缘计算普及的共同承诺。我们期待携手广和通及更多生态伙伴,共同把握AI浪潮下的产业新机遇,让智能计算无处不在。”  结构上,具身智能机器人开发平台Fibot采用了创新性的全向轮底盘设计,使其具有狭窄空间的原地旋转或平移运动的能力;可拆卸式训练臂的结构设计方便客户完成算法开发后进行实测与部署。此外该平台相比原斯坦福Mobile ALOHA方案,赋予了机械臂更多的自由度及臂展范围,并对机械臂额定负载能力进行了超150%的优化,提升了开发平台在复杂场景或任务的适应能力。  得益于以上卓越性能,广和通具身智能机器人开发平台Fibot可助力机器人厂商进行软件及算法的二次开发,赋能具身机器人广泛应用于工业制造、家用服务、智慧物流等场景。随着AI开发生态不断发展,该开发平台将为更多机器人终端带来可商用的软硬件基础。  具身智能机器人开发平台Fibot的面世展现了广和通在机器人领域技术与产品研发的丰富成果,同时也是广和通在5G和AI领域深耕的集中体现。随着芯片算力的提升和软硬件的持续优化,广和通将为机器人行业提供更多的AI解决方案,携手产业伙伴共趋人工智能的下一个浪潮。
关键词:
发布时间:2024-03-29 09:00 阅读量:855 继续阅读>>
昆仑芯获评“2023中国AI<span style='color:red'>算力</span>层创新企业”
  近日,由中国科技产业智库「甲子光年」主办的「共赴山海·2023甲子引力X智能新世代」峰会于上海成功举办。会上,「星辰20创新企业」重磅发布,昆仑芯凭借领先AI技术创新优势、丰富落地成果获评“星辰20:2023中国AI算力层创新企业”。  2023年以来,科技产业迎来大变局。为共同迎接AI 2.0智能新世代的到来,促进发展与交流,大会推出2023“星辰 20:创新企业”榜单,旨在进一步推动行业发展,为中国人工智能产业的未来注入更多活力和动力。  该系列榜单综合考虑企业的品牌力因素、主要产品、融资能力、研发实力、商业化能力等因素,评选出在AI算力层、AI数据平台层、AI大模型、AIGC中间层、AIGC应用层、元宇宙领域有突出贡献和影响力的企业,以表彰2022年度在科技产业各赛道上拥有核心技术实力、在商业化上颇有成效的优秀成长型科技公司。  AIGC时代背景下,国内大模型技术发展正当其时,对AI算力提出更高要求。作为AI芯片领域的先行者,昆仑芯以强大AI算力为大模型的性能优化、产业落地全链路提供“更快、更强、更省”的端到端解决方案。  昆仑芯前身为百度智能芯片及架构部,于2021年完成独立融资,首轮估值130亿元。深耕AI加速领域十余年,昆仑芯具备深刻的场景理解能力,拥有全方位的产品视角。目前,公司两代芯片产品均已实现量产和数万片扎实落地,为“智慧+”场景提供开箱即用的产品。  两代芯片产品的成功迭代和规模落地,离不开昆仑芯的深厚科研实力和创新能力。公司团队成员拥有卓越学术背景,多数成员在数据中心、无人驾驶等各类AI场景均有丰富研发经验。在学术成果与工程落地并重的理念指导下,团队于2017年推出自研核心架构昆仑芯XPU,研究成果也在Hot Chips、ISSCC等国际顶级学术会议中成功发表。  为实现在多场景下的商业化落地,公司紧密关注AI技术前沿和市场需求变化,持续推进核心技术攻关。面向市场需求愈加迫切的大模型场景,昆仑芯即将推出一款加速器组解决方案,训推一体化助力提高资源利用率,持续领跑大模型产业化落地。  未来,昆仑芯将继续深入AI领域应用场景,优化芯片产品性能,携手AI产业上下游生态伙伴,构建软硬一体化的AI芯片生态,为千行百业提供普惠的AI算力,创造更大的商业和社会价值。
关键词:
发布时间:2023-04-28 10:07 阅读量:2064 继续阅读>>
年增长率近30% 我国<span style='color:red'>算力</span>总规模全球第二
昆仑芯科技副总裁孙孝思:AI大模型的突破与创新需要<span style='color:red'>算力</span>基础设施
  2022年是整个人工智能芯片行业充满挑战的一年,从业者们都感受到丝丝寒意。因为2022年不仅处于疫情的波动期中,国际形势还对整个人工智能产业带来了限制。然而进入2023年后,CHATGPT带来了一点暖意。CHATGPT可以说是迄今为止增长最快的消费应用程序,它不是一触即发的,而是基于其前三代,不断迭代产生的,直到今天的爆发。  为什么如今有更多的人关注它,很多演讲人也不断提及它?因为CHATGPT带来了质的飞跃,超越了人类平均基准线。  来源:GARTNER2022年人工智能技术成熟度曲线  GARTNER在2022年发布了一个人工智能技术成熟度曲线,生成式人工智能处于技术萌芽和期望的膨胀期,也就是说,技术从最初我们在人工智能的理解上,开始慢慢向发展阶段过渡,这对于人工智能产业中,无论是做芯片、框架,还是做算法的人来说,都是一个极大的利好。  01  CHATGPT背后:  算法、数据、算力三要素共振  CHATGPT背后是什么?今天在场的郑纬民院士以及其他很多演讲者此前都有提到,根源在于算法、数据、算力三个要素之间的共振。  算力方面,现在的CHATGPT是基于GPT3.5的大模型,在训练中使用了微软专门建设的AI计算系统,由1万个业界主流GPU组成的高性能网络集群,总算力消耗约3640 PF-DAYS。  数据方面,GPT-2的数据量是40G,GPT3的数据量达到了45TB,这是一个大规模的数据量的跃升。  算法方面,如前所述,它不是一蹴而就的,而是经过了几次迭代。  这几年的数据、算法、算力方面都有非常大的变化。中国在数据方面非常有优势,我们有场景、有大量的数据。在算法方面,实现了跨模态的融合,包括语音、图文、视频等很多方向。算力供给方面,这几年全国各地都在推进算力建设,我们相信未来国内的应用会有很大的变化和增长。  02  AI大模型应用突破与技术创新:  目前,国内有很多关于CHATGPT的研究,除了清华大学的“八卦炉”,还有阿里、腾讯的大模型,也包括百度。百度即将在3月16日发布的文心一言,背后其实也是大参数、大算力、大数据量。我们可以意识到,未来的应用突破和技术创新需要算力的基础设施。  也许有人会问,下一个CHATGPT到底是什么?现在火爆的聊天、语音生成属于CHATGPT的范畴,但是未来会有很多的衍生物,例如文本生成、视频生成、音频生成、虚拟人生成方面。  我们认为,未来会有几个依托于算力的大场景,其中一大场景就是自动驾驶。自动驾驶场景中,模型感知和场景库的仿真训练需要上千P的算力。目前,我们跟新能源头部车企有很多紧密联动,我们发现自动驾驶的发展需要算力来提供技术的突破和跃升。生物医药也对算力有很强的需求,我们也看到了人工智能发挥的作用,例如ALPHAFOLD已预测出全球几乎所有已知蛋白质结构。  可能有很多算力基础设施商都在思考,建了那么多数据中心、算力中心,到底应用在哪些地方?我们回顾一下,北京最早的京藏高速,我们叫G6,建设初期一辆车都没有,但今天却是北京堵车最严重的一条高速公路。还有4G网络,最早国家在建设4G网络的时候,大家都认为3G网络已经足够用了,为什么要上4G?为什么要投入那么大的成本?但今天看来,也有人觉得4G网络卡。所以我们要重新理解算力,它其实是信息基础设施。  算力网络的布局会很大程度激发人工智能的应用和技术创新。  目前,算力成本普遍偏高,有很多中小企业的创新在一定程度上受到了成本的影响。例如,复旦大学做MOSS大模型的时候,也会考虑到学校、科研机构是否能够承担起大模型的训练。  从政府、国家、行业的角度看,我们怎么能够实现算力的普惠?我相信2023年之后,在算力建设过程当中,除了我们这些企业,各方都将更多参与进来,这样才能够真正实现普惠,大大降低企业使用算力的成本。  03  场景、数据驱动下人工智能芯片的挑战  算力对于场景的创新很重要。但是作为一个人工智能芯片的企业,我们也充分认识到,在市场需求打开的情况下,整个人工智能芯片也面临巨大挑战。  资料来源:《AI算力的阿喀琉斯之踵:内存墙》  上图中,蓝线上是视频、自然语言处理和语音模型,其模型运算量平均每两年翻15倍;红线上TRANSFORMER的这种神经网络大模型,其模型运算量平均每两年会翻750倍;而灰线则标志摩尔定律下内存硬件大小的增长,平均每两年翻2倍。  因此,可以由此想到两点:第一,未来摩尔定律会面临失效的风险;第二,要考虑内存墙的存在。对于整个芯片行业的发展来说,如何在未来的演进中找到突破口,其实CHIPLET是一个方向。可见,先进封装技术对于AI芯片行业将是一个重要的助推器。这几年,昆仑芯科技也在这方面做了很多基础研发。  人工智能芯片离不开工程实现,为什么这么说?因为它毕竟是一个产品,想要在行业跟场景紧密结合,必须解决三个问题:通用性、易用性和性价比。  企业、高校可以在基础科研上做很多的探索,人工智能芯片企业同时必须要考虑到它的应用、商业化落地等问题。如何去解决通用性、易用性和性价比的问题,是人工智能芯片厂商共同面临的挑战。  芯片不是一个标品。在硬件层面,我们可以达到业界主流GPU产品差不多的性能指标,但在软件层面上差距较大。从同行的角度来看,我们需要自己的软件栈去解决通用性问题,也要给开发者提供更好的软件栈,让开发者可以基于国内的人工智能芯片做开发。  04  结语  昆仑芯科技前身是百度智能芯片及架构部,虽成立不久,却已有十余年的芯片研发经验。基于百度丰富的AI场景积累,昆仑芯产品实现了与场景需求、客户需求的紧密耦合。  基于对场景的深刻理解,昆仑芯与智能产业的上下游携手,逐步构建起软硬一体化的AI芯片生态。目前,昆仑芯产品已与百度飞桨、PYTORCH、TENSORFLOW等主流框架和服务器完成适配。  完善解决方案才能够真正赋能产业。昆仑芯两代芯片产品均已实现量产,并凭借其强大通用性、易用性和高性能,广泛部署在智慧金融、智慧交通、智慧工业等领域,不断提供更优秀、更高效的解决方案,为客户提供更好的服务。  未来,我们希望可以和在座的同行们一起共筑合力,赋能芯片产品与应用场景更紧密结合,在人工智能产业发展中构建更加繁荣的生态系统。
关键词:
发布时间:2023-03-09 10:13 阅读量:1923 继续阅读>>
昆仑芯强大<span style='color:red'>算力</span>新品:R100正式发布
  近日,Ameya代理品牌昆仑芯新品R100于2022智算峰会「智能芯力量」专题论坛正式发布。昆仑芯AI加速卡R100(以下简称“昆仑芯R100”)定位于边缘大算力推理,较昆仑芯1代AI加速卡K100平均性能提升2.3倍,以更低功耗、更小巧体积灵活适配各类服务器,赋能多种复杂边缘推理场景。  强大AI边缘推理能力离不开高效的核心计算架构。昆仑芯R100采用昆仑芯2代AI芯片,搭载昆仑芯新一代自研架构XPU-R。该架构可满足多样AI模型和场景需求,为AI加速卡提供最优的性能和能耗效率。  在INT8精度下,昆仑芯R100峰值性能可达到170TOPS,同时支持FP16、FP32等精度计算;采用GDDR6高速显存,可实现384GB/s的显存速率;支持从视频、图像解码到AI模型推理、再到视频图像编码输出的全流程业务;支持84路全高清视频解码和27路全高清视频编码。  昆仑芯R100继承了昆仑芯2代的成熟软件栈,为用户提供全方位的软件工具包。用户可将在昆仑芯R200/R300上已适配和已训练的模型平滑迁移至昆仑芯R100上。昆仑芯R100既可在标准服务器中灵活实现多卡配置,也适用对服务器尺寸有特定要求的工控机等设备,以服务于智慧零售、智能交通、智慧园区和智能制造等各类边缘推理场景。  昆仑芯AI加速卡R100  目前,昆仑芯科技与百度智能云强强联合,已推出多款搭载昆仑芯AI加速卡R100的边缘硬件,从边缘盒子到边缘服务器,为诸多场景的解决方案提供了业内领先的AI算力保障。
关键词:
发布时间:2023-02-06 13:03 阅读量:2150 继续阅读>>
ARM中国发布“周易”Z2 AIPU:单核<span style='color:red'>算力</span>提升一倍 芯片面积减少30%
【TechWeb】10月14日消息,ARM在中国的分支“安谋中国”虽然此前陷入混乱的人事动乱,不过看起来这些问题并未影响到安谋中国在技术和产品上的推进。近期安谋中国正式发布AI专用处理器 “周易”Z2 AIPU(AI Processing Unit)。单核算力最高可达4TOPS,较“周易”Z1 AIPU的单核算力提高一倍,同时支持多达32核的可扩展配置,从而能够在单个SoC中实现128TOPS的强大算力。全新“周易”Z2 AIPU将主要面向中高端安防、智能座舱和ADAS、边缘服务器等应用场景。据介绍,“周易”Z2 AIPU延用了“周易”AIPU的架构,并在微架构上进行了优化,从而将芯片面积减少30%,在运行部分神经网络模型时,相同算力配置下性能提升可达100%。此外,“周易”Z2 AIPU对内存子系统也进行了优化,并升级了高级带宽节省技术(Advanced Bandwidth Saving Technology,ABST),除了第一代中已有的权重压缩(weight compression)技术之外,还增加了feature map压缩技术。“周易”Z2 AIPU支持三种配置,分别是:4TOPS算力的Z2-1104,2TOPS算力的Z2-1002和1TOPS算力的Z2-0901,目前已完成LAC版本的开发,并将在年底前向中国客户提供所有配置的EAC版本。预计搭载“周易”Z2 AIPU的客户芯片将于2021年面世。2018年6月,Arm把中国业务分拆成了独立公司“安谋(Arm)中国”,这家公司由中资51%控股。2018年11月,安谋中国发布了“周易”人工智能平台,其中“周易”Z1 AIPU是安谋中国合资公司成立后第一款正式对外发布的本土研发IP产品。“周易”AIPU是由安谋中国针对深度学习而自主研发的创新性AI专用处理器,它采用了创新性的架构设计,提供完整的硬件和软件生态,并且具有PPA最佳平衡。安谋中国还为“周易”AIPU的客户提供很多工具来帮助他们进行开发,包括仿真器、编译器和调试器等进行数据的采集、分析。“周易”AIPU也支持业界主流的AI规模框架,包括TensorFlow、ONNX等,未来也将支持更多不同的扩展框架。安谋中国研发常务副总裁刘澍表示:“在过去的一年多时间里,‘周易’Z1 AIPU得到了很多中国客户的信赖,并且已有包括全志科技在内的合作伙伴完成了基于‘周易’Z1 AIPU的产品研发和流片。全新的‘周易’Z2 AIPU,延续了‘周易’系列AIPU的架构以及可编程性的核心特点和优势,凭借更高的算力和可扩展性为他们基于‘周易’AIPU的芯片产品开辟了更广阔的人工智能应用领域。”ARM近期绯闻不断。9月,英伟达宣布同软银达成了收购ARM的协议,此举在半导体领域掀起大波澜。另一方面,今年6月开始,ARM在中国的分支“安谋中国”也陷入“ARM中国董事长吴雄昂罢免陷风波”中。以ARM英国、厚朴投资为代表的“ARM公司”和“安谋科技(中国)有限公司”先后发布了“罢免”和“未发生人事变动”的两份截然不同的声明。
发布时间:2020-10-14 00:00 阅读量:2033 继续阅读>>
人工智能想要落地安防行业,<span style='color:red'>算力</span>还远远不够?
随着技术水平的不断提升以及在社会生活各个领域中的应用,人工智能已经不再被视为一种“魔法”,而成为赋能社会各行各业的生产力。百度创始人李彦宏坦言,现阶段“人工智能不再讲究酷炫,而是要讲究如何扎扎实实地推进和落地。” 如果说AI是蒸汽机与内燃机,那么AI算力则是“煤炭与石油”——AI 应用建立在算力之上,若没有算力可“烧”,AI将是空中楼阁。OpenAI的一份全球AI算力供需研究报告显示,AI算力需求量每三个半月就会翻一番,从2012年到2018年,全球算力需求增长了30万倍。 算力缺乏阻碍智能摄像头发展交通、零售、物流、智慧城市……传统的安防行业正因为人工智能而拓展到更多维度。然而,当下AI算力却捉襟见肘,无法满足特定计算需求。受到算力、算法和技术标准等因素的制约,安防监控视频的快速处理和深度利用仍需要大量使用人工分析。 算力的缺乏也导致智能安防摄像头普及速度低于预期。目前常见的智能摄像头大多应用于基本监控场景,要对复杂场景进行多目标的实时识别和分析,终端算力还无法支持。因此,目前的摄像头可以算作前端智能化,而非智能前端化。当然,也可以将视频送到云端去处理,但这样又会带来高延迟和数据安全性的问题。 “未来的市场必定是数据规模和计算能力的角逐。” 浪潮商用机器有限公司OpenPOWER产品营销部总监张琪表示。谁能够在解决算力不足问题的同时又能够更好降低功耗与成本,谁就能在AI浪潮下占领安防鳌头。 多技术结合缓解难题AI算力不足的问题正在不断被相关企业解决。例如集合了云端计算、边缘计算、端侧计算的一体化部署方案,能一定程度上缓解摄像头算力不足的难题。 AI无论应用于消费还是行业场景,其未来的算力是多点协同性质的。这就要求针对不同问题场景提供不同解决方案,这些方案需要能够解决针对异构的适配能力和迁移能力,以便更好地前向兼容。 例如某些To B场景中,将摄像头额外叠加AI算力形成“胖终端”,通过外设将图像识别置于本地,一方面降低时延,一方面减轻了对于网络连接和容量的需求。 这些方案的设计本质上就是要解决一个问题——分配好终端和云端分别需要完成的任务。但业界对AI算力应更多部署在前端还是后台尚无统一意见。 将合适的算力放到合适的位置要解决好算力问题,安防领域需要云边端协同发展,将合适的算力放到合适的位置。当然,算力并非孤立存在,其他因素也将影响算力的使用。例如若没有进行存储优化,那么芯片实际能够提供的计算力其实会大大低于理论值。 那么,如何分配算力并平衡好其他影响因素?海康威视的AI Cloud架构或许可以提供思路:利用云计算中心弹性分配计算服务器、存储服务器的资源,够按需调度智能算法和大数据算法。 由于人工智能技术整体发展还处于初级阶段,智慧安防行业也随之面临很大的不确定性,而这也为各种安防企业提供了巨大的舞台,舞台上将呈现怎样精彩的表演?令人期待!
发布时间:2019-09-09 00:00 阅读量:1644 继续阅读>>
第一个把AI芯片带进手机的华为 今年<span style='color:red'>算力</span>要飞?
看似高深的人工智能(AI)技术,其实已经“润物细无声”地深入大众生活,仅你手中一部华为Mate20手机,就可以实现人脸识别、物体识别、物体检测、图像分割、智能翻译等AI功能。这背后,依仗的是手机算力的大幅提升。其中小小一枚一分钱硬币大小的华为麒麟980手机芯片,就集成了69亿个晶体管,具备每秒钟完成万亿次级运算的能力。你可能想不到,如今自己手中任何普通智能手机的算力,甚至比美国航空航天局1969年登月计划中最先进计算机还高出几百上千万倍乃至更高。数据、算力和算法,驱动着人工智能的第三次浪潮。其中,算力正是重要的基石。手机端的芯片算力几年间已经发展到如此惊人,用于云端的AI芯片需要处理自动驾驶等复杂场景的海量数据,又需要多强大的算力呢? OpenAI近期发布的研究显示,仅2012年以来,人们对于算力的需求增长六年就超过 30万倍,平均每年增长10倍,远远超过了摩尔定律的发展速度,因为深度学习神经网络需要对张量(可以简化理解为矩阵)进行大规模并行计算,颠覆了传统的浮点计算,对算力的需求正在出现指数级的爆炸式增长。例如原来1个时钟单元只能计算1次浮点计算,现在可以通过新的算子同时对N*N的矩阵计算,如果N=10,那就是同时计算了100次,计算次数较原来增长了100倍,新算子带来了对新芯片的强大算力诉求。如果说2019年最受舆论关注的ICT和智能终端厂商是华为,那么其去年10月以来一直“犹抱琵琶半遮面”的业界算力最高AI处理器——Ascend(昇腾)910芯片,则是人工智能圈本年度最期待的AI芯片。面对 AI 算力需求的爆发式增长,这几年华为在做些什么?率先将专用NPU AI芯片引入手机人工智能发展中,我国在数据方面具备优势,但在算法与算力方面仍待发展,尤其是芯片与硬件代表的算力方面。算法科学家、工程师和应用厂商面临着AI算力稀缺和昂贵问题,大大抬高了算法研究和创新门槛,阻碍着AI的全行业普及和应用。正因如此,尽管AI芯片在金钱、时间和人力各方面的研发成本高昂,但在AI商业赛道上,各厂商都在打造各自的芯片体系,其中多为聚焦于某一应用或某一场景的互联网和芯片厂商,也不乏ICT大厂。国内厂商中,华为在AI芯片的布局堪称“经典”。在AlphaGo一战成名之前,绝大多国人就已经完成了从功能手机到第一代智能手机的换代,不断增长的手机系统自带功能特性和第三方应用,刷新着用户的体验。无论是AI功能还是场景化AI服务,都需要手机完成复杂深度学习算法模型运算,计算密集复杂,计算需求巨大,实时性非常挑战;同时运行环境受限,功耗、内存、存储空间非常挑战,因此强大的算力是必须的。如何将人工智能引入到手机终端,是彼时苹果、华为在内的手机厂商都在努力攻破的问题。2017年9月的柏林电子消费展上,华为正式向发布全球首款移动端AI芯片麒麟970,一个月后发布了搭载麒麟970的旗舰手机Mate 10。麒麟970是全球首款内置了独立神经网络处理单元(即NPU)的人工智能芯片。华为第一个将NPU引入手机芯片,在此之后,苹果、三星等厂商纷纷跟进,到今天,AI手机已成为众多手机厂商的旗舰配置。麒麟970内置NPU性能大幅优于CPU、GPU和DSP这些通用计算单元。同时相比CPU获得了约50倍能效和25倍性能优势。这意味着,麒麟970芯片可以用更少的能耗更快地完成AI计算任务。  在NPU的加持下,手机功能也会变得更加强大。例如使用语音功能时,AI会对当前语境和内容进行细致的分析,从而实现高准确率的识别体验,将语音识别的成功率提升到更高的级别。这样一来,以智能助手为主语音功能就得以替代传统的手工输入,扮演更重要的角色,或许以后大街上见不到边玩边走“低头族”,而是更多人对着手机“自言自语”了。在用户十分关心的拍照方面,AI的出现同样为喜欢手机摄影的用户带来不少福利。麒麟970搭载双通道ISP图像信号处理器,在动态影像捕捉和低光拍照上有很大的提升。双摄镜头+双ISP软硬件优化、再配合人工智能的计算机视觉分析,便能自动分析画面内的物体,并选择当前最佳的拍照模式,甚至可以进行物体追踪对焦和预测用户拍照时机,提供前所未有的拍照体验。麒麟970的推出,成为传统智能手机和未来AI手机的重要分水岭,AI手机的发展也从单纯的算法优化进入了硬件能力的真·人工智能比拼阶段。2018年8月,同样是在柏林电子消费展上,华为又发布了全球首款7nm人工智能手机芯片——麒麟980。1纳米等于1毫微米(即十亿分之一米),约为10个原子的长度。一根头发丝直径约为0.1毫米,而7nm相当于头发丝的万分之一,在不到1平方厘米的麒麟980内部有高达69亿个晶体管。从芯片工艺上看,7nm相当于70个原子直径,逼近了硅基半导体工艺的物理极限,麒麟980实现了在针尖上翩翩起舞。华为消费者业务CEO余承东表示,麒麟980的7nm工艺是由超过1000多名半导体工程师组成的团队历时3年时间、经历超过5000多次的工程验证精心打磨的成果。相对于麒麟970来说,麒麟980全面升级。以图像识别速度为例,麒麟970可达到约2005张每分钟,而麒麟980在移动端双NPU强大算力加持下,实现每分钟图像识别4500张,识别速度相比上一代提升120%,远高于业界同期水平。随之而来的,是人脸识别、语音助手、AI拍照,及各类智能美拍P图等APP在手机上的全面升级。同时,面对更海量的用户,麒麟710让更多消费者享受到人工智能的乐趣。到了2019年,华为推出麒麟810芯片,这是华为第二款7nm工艺的手机芯片,也是华为首款自研达芬奇架构NPU的手机芯片,这意味着更多海量用户享受到专用NPU带来的旗舰级的AI体验。至此,华为完成第一轮在手机端的AI芯片布局(麒麟970、麒麟980、麒麟710、麒麟810),手机产业也正式走入了AI时代。“达芬奇”构建端边云算力大爆发基础AI赛道比拼,影响的绝不仅是手机端,边缘侧、云侧的硬件算力、数据算法等元素无一不处于白热化的竞赛之中,几乎每天都有新的论文、新的产品问世。如果说华为在芯片上的持续投入属“居安思危”,显示的是其远见与决心。那么,华为在人工智能领域的野心则更为宏大,这一次,华为不仅要覆盖 云、边、端各种场景,还要形成从应用使能到系统到芯片的闭环。2018年10月,华为在其全联接大会上首次提出全栈全场景 AI 解决方案,华为轮值董事长徐直军表示,“全场景,是指包括公有云、私有云、各种边缘计算、物联网行业终端以及消费类终端等部署环境。全栈是技术功能视角,是指包括芯片、芯片使能、训练和推理框架和应用使能在内的全堆栈方案。”其中,全栈AI的基础,是一系列基于统一的达芬奇架构的AI芯片——从IoT到终端(如麒麟芯片的NPU)、到边缘侧再到云。在会上,徐直军还宣布,“外界一直在传华为在开发AI芯片,我要告诉大家,这是事实,我们今天发布两颗AI芯片:华为昇腾(Ascend)910和310。”此言一出,立刻在国内外人工智能圈子惊起波澜——华为终于祭出了大招。达芬奇架构针对AI运算特征而设计,以高性能3D Cube计算引擎为基础,实现了算力和能效的大幅提升。从云、边缘、端独立的和协同的AI实际需求出发,从极致低功耗,到极致大算力的AI场景,为云、边、端之间的算法协同、迁移、部署、升级和运维,提供了统一架构底层核心支撑,大大降低了人工智能算法开发和迭代的门槛,降低企业人工智能部署和商用成本。目前,昇腾(Ascend)芯片家族中的昇腾310已经落地商用。基于昇腾310,华为陆续发布了包括Atlas 200、Atlas 300、Atlas 500、Atlas 800等产品,已被广泛应用于安防、金融、医疗、交通、电力、汽车等行业,涉及摄像机、无人机、机器人、智能小站、MDC(Mobile Data Center)等产品形态。并提供基于昇腾310的AI云服务,比如华为云图像分析类服务、OCR服务、视频智能分析服务等超过50款API已经基于昇腾310,日均调用量超过1亿次。另有大量企业客户正在借助昇腾310芯片自己开发算法服务。随着昇腾310相关产品大规模上市,外界对昇腾910的期待更盛。毕竟,去年10月,徐直军在会上公布,“昇腾910是计算密度最大的单芯片,最大功耗为350W,半精度为(FP 16)256 Tera FLOPS,比英伟达 V100的125 Tera FLOPS还要高出近1倍。若集齐1024个昇腾910,将会出现迄今为止全球最大的AI计算集群,性能也将达到256个P,不管多复杂的模型都能轻松训练。”简单来说就是,昇腾910是业界算力最高的AI处理器,相同功耗情况下,它的算力是业界芯片的2倍,最强CPU的50倍。全栈全场景AI逐步落地除了昇腾系列芯片外,华为提出的全栈AI,还包括支持端、边、云独立的和协同的统一训练和推理框架MindSpore,芯片算子库和高度自动化算子开发工具——CANN,提供全流程服务(ModelArts)、分层API和预集成方案的应用使能。其中,在2019年已经落地实现商用的,除了昇腾310,还有其面向用户和开发者的门户——华为云ModelArts。作为一站式AI开发平台,ModelArts可以提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期 AI 工作流。2019年5月,在斯坦福大学DAWNBench榜单,华为云ModelArts获得图像识别训练第一,ImageNet-1k数据集上用128块V100 GPU训练ResNet-50模型仅需要2分43秒,而在2017年10月,斯坦福DAWN的训练时间是13天10小时41分钟。斯坦福大学DAWNBench榜单几乎聚集了国内外领先AI厂商,ModelArts如果由强大的昇腾910加持,是否能进一步刷新世界纪录?若再采用1024个昇腾910的全球最大AI计算集群,又将出现什么样的成绩?从端侧到边缘侧再到云侧,从底层硬件到深度学习框架再到上层应用使能,华为的全栈全场景AI战略正在逐步落地。在一年前关于AI的豪言中,哪些是华为下一步将要向市场兑现的呢?我们拭目以待。
关键词:
发布时间:2019-08-23 00:00 阅读量:2198 继续阅读>>

跳转至

/ 1

  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
BD71847AMWV-E2 ROHM Semiconductor
MC33074DR2G onsemi
TL431ACLPR Texas Instruments
CDZVT2R20B ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
型号 品牌 抢购
TPS63050YFFR Texas Instruments
IPZ40N04S5L4R8ATMA1 Infineon Technologies
ESR03EZPJ151 ROHM Semiconductor
BU33JA2MNVX-CTL ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
BP3621 ROHM Semiconductor
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
关于我们
AMEYA360商城(www.ameya360.com)上线于2011年,现有超过3500家优质供应商,收录600万种产品型号数据,100多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+连接器等多个领域,平台主营业务涵盖电子元器件现货销售、BOM配单及提供产品配套资料等,为广大客户提供一站式购销服务。