广和通：“轻量级”小模型如何发挥“重量级”作用？-Ameya360电子元器件采购网

广和通：“轻量级”小模型如何发挥“重量级”作用？

发布时间：2024-07-30 09:19

作者：AMEYA360

来源：广和通

阅读量：653

　　当大家都还在钻研参数规模达百亿甚至千亿级的大模型时，精巧且兼具性能的小模型已逐步应用于边缘智能终端与嵌入式系统，以“小身板”发挥大作用。相较于大模型，小模型更便于在计算能力和存储空间受限的智能终端运行，在边缘侧即完成计算。

　　端侧AI模型的趋势，变得“越来越小”。

　　大模型指的是参数量巨大的机器学习模型，参数数量通常在数百亿到数千亿之间，具有强大的计算能力和推理能力，获得更好的性能。“小模型”则是参数量在数亿到数十亿之间，存储和计算资源方面的需求相对较低，能够在端侧进行部署和推理。

　　为达到更好的训练效果，小模型的训练语料库可能比大模型更强大，使每一个参数更具价值。另一方面，以大模型为基础，通过知识蒸馏(Knowledge distillation)、量化、剪枝等模型压缩方法也是打造高质小模型的方式之一。今年4月，Meta发布了最新一代大模型Llama 3，其小参数模型效率高于Llama 2的大参数模型。如何让更小的模型具备更好的效果，已然是大模型公司的竞争焦点。

　　相比于不得不部署于云端的千亿参数大模型，小模型可在边缘侧实现快速部署和运行，提高终端边缘计算能力和效率。这种“瘦身型”AI算力部署，将提高智能终端的运算能力，实现更多自我学习、自我工作、自我决策的功能。

　　广和通基于高通QCM6490处理器的解决方案搭载了8核高性能处理器，其最高达13TOPS的算力可高效地进行数据计算与处理，运行各类0.5B/1.8B/3B/7B的开源大语言模型，为智能支付、自助服务机、工业检测、具身智能等终端提供了边缘计算的能力。此外，该解决方案还可运行精简小模型，帮助客户在成本、性能、存储、效率上达到平衡。

　　无论是大模型，还是小模型，应用的根本是打造离用户更近的模型，助力各类场景智能化。面向端侧AI部署需求，计算效率高、资源占用少、快速迭代的小模型更能定制化地实现边缘计算能力，充分发挥“高效率”的大作用。

（备注：文章来源于网络，信息仅供参考，不代表本网站观点，如有侵权请联系删除！）

行业新闻

广和通：从云到端：离客户更近的端侧AI“涌现”而至

　　AI发展正酣，随着终端芯片算力越来越高、端侧模型能力越来越强、实时响应及隐私保护的端侧应用需求增加，端侧AI已然具备落地的条件。端侧AI离客户和应用场景更近，也是具象化AI的重要方式。可以看到，端侧AI的浪潮“涌现”而至，原有的用户体验和生态格局将迎来革命性重塑。　　端侧AI是指在终端设备(如车载智能座舱、智能除草机、机器人等终端场景或设备)上进行人工智能计算和处理，运行端侧模型。相较于云端大模型，端侧大模型在资源有限的设备上高效运行，需进一步对模型进行压缩、推理加速及能耗优化。目前轻量化模型技术包含模型剪枝、知识蒸馏和量化，以上技术往往组合使用，以达到最优的轻量化效果。将大模型部署在端侧设备中，可高效赋能智能终端，如降低延迟，更快地响应用户请求;隐私保护，减少数据传输，从而降低隐私泄露的风险;减轻云端服务器的计算负担，降低对中心化计算资源的依赖，从而降低成本;根据用户的具体设备和使用习惯进行定制化优化，提供更加个性化的服务;无网络连接的情况下也能使用，提高了应用的可用性和灵活性。　　基于大模型在端侧部署的特点和优势，已落地或即将落地的应用场景包括：智能手机、智能家居、可穿戴设备、自动驾驶汽车、工业自动化、医疗设备等。随着AI技术的进步和芯片产业的发展，端侧部署AI的挑战正逐步被克服，更多的端侧应用场景正在落地实现并逐渐成熟。　　首先，大模型本身的算法逐步在优化，在众多细分行业，模型的计算效率相较上一代均有一定量级的效率提升。模型参数变得更小，用户体验却更加智能。再者，更多参数较小的大模型被开源，且AI能力日趋成熟，例如智谱AI、阿里千问等大模型厂商都开源了亿级(0.xB左右)到百亿级(x0B)的大模型预训练模型。这大大降低了大模型应用开发者的使用门槛，同时加速端侧AI部署。此外，算法层级的技术，包括模型量化、剪枝、蒸馏为基础的模型压缩算法，以及专为端侧部署设计的软硬件平台，都正在快速发展，这使得大模型在端侧设备的部署变得更加高效。以上模型变化趋势使得端侧AI在本地所需算力、部署成本、运行效率得到大大提升，将助力各行各业智能升级。　　目前，端侧AI芯片厂商、中游模组及软件厂商、下游终端厂商的产业链上下游正积极推动 AI在端侧部署落地。多个芯片厂商已推出最新处理器，支持终端侧多模态生成式AI，并完成多款大模型的适配。广和通持续为AIoT产业提供模组及解决方案，正积极探索端侧AI相关技术，并已推出多款可应用于机器视觉、具身智能、智能割草等场景的端侧AI解决方案，满足不同终端对算力及模型的需求。　　在端侧AI应用上，广和通深度布局视觉与听觉计算，推出高算力和轻量化机器视觉解决方案，融合了先进的处理能力与边缘计算优势，采用了目标检测、关键点检测、图像分割、超分辨率、图像增强、360环视拼接等高效的视觉处理算法。此外，广和通机器视觉解决方案支持蓝牙、Wi-Fi等多种无线通信连接方式，在高端智能影像终端、工业视觉终端、车载终端、机器人均具有广泛应用场景。　　AI大模型作为当前人工智能领域的重要技术，是孕育新质生产力的重要手段。作为大模型应用的一个重要的实践领域，端侧 AI大模型的全面落地发展需要全产业链推动，包括芯片算力增强、模型优化、软件厂商适配以及终端厂商的落地应用。广和通积极整合产业上下游资源，为产业提供融合通信、算力、AI算法、AI引擎、模型等能力的端侧AI解决方案，加速AI商用至终端。

2024-12-12 11:18 阅读量：326

型号	品牌	询价
RB751G-40T2R	ROHM Semiconductor
BD71847AMWV-E2	ROHM Semiconductor
CDZVT2R20B	ROHM Semiconductor
MC33074DR2G	onsemi
TL431ACLPR	Texas Instruments

型号

品牌

询价

ROHM Semiconductor

ROHM Semiconductor

ROHM Semiconductor

onsemi

Texas Instruments

型号	品牌	抢购
IPZ40N04S5L4R8ATMA1	Infineon Technologies
STM32F429IGT6	STMicroelectronics
ESR03EZPJ151	ROHM Semiconductor
TPS63050YFFR	Texas Instruments
BP3621	ROHM Semiconductor
BU33JA2MNVX-CTL	ROHM Semiconductor

型号

品牌

抢购

IPZ40N04S5L4R8ATMA1

Infineon Technologies

STMicroelectronics

ROHM Semiconductor

Texas Instruments