昆仑芯漆维:多维度创新应对大模型时代的算力挑战

发布时间:2023-09-08 09:32
作者:AMEYA360
来源:昆仑芯
阅读量:3818

  近日,2023百度云智大会于北京圆满落幕。众多人工智能领域专家、行业精英、意见领袖等齐聚一堂,共同站在大模型重构未来的新起点,展望大模型创新发展之路。

  作为百度四层架构的坚实算力底座,昆仑芯携两代芯片产品重磅亮相主会场及“智能计算&大模型技术论坛”展区。昆仑芯科技芯片研发总监漆维在专题论坛上进行精彩主题演讲,获得与会嘉宾及各级媒体的广泛关注。

  大会期间,昆仑芯以多媒体形式展示芯片产品的领先性能优势,为嘉宾直观呈现昆仑芯产品强大性能以及赋能千行百业的落地成果。

  在百度的四层架构中,昆仑芯作为强大算力底座,通过对市场需求的深刻洞察,率先布局大模型领域。同时,昆仑芯与框架、模型、应用层高效协同,通过端到端软硬逐层优化,携手打造大模型端到端解决方案,实现了百家客户、数万片规模部署。

昆仑芯漆维:多维度创新应对大模型时代的算力挑战

  昆仑芯科技芯片研发总监 漆维

  “智能计算&大模型技术论坛”上,昆仑芯科技芯片研发总监漆维带来了“昆仑芯端到端大模型算力解决方案”主题分享。面对大模型时代计算的效率和成本问题,昆仑芯通过架构创新、产品定义创新以及软件创新,打造出基于自研核心架构XPU-R的大模型产品矩阵。针对不同参数量级的大模型场景,昆仑芯兼具显存和成本优势:

  *昆仑芯AI加速卡R200-8F面向百亿以内参数量级,相比同类型产品性能提升20%;

  *昆仑芯AI加速器组R480-X8面向百亿至千亿参数量级,性能达到同类型产品的1.5倍以上;

  *昆仑芯AI加速器组R480-X8集群针对千亿以上参数量级,可实现多机多卡分布式推理。

  “作为一款人工智能芯片,从芯片完成设计到真正走向行业落地,生态是其中非常重要的环节。”漆维在演讲中分享了昆仑芯在软件生态方面的成果。目前,昆仑芯提供了针对大模型场景的昆仑芯XFT(XPU Faster Transformer)推理加速库、丰富的云原生插件。同时,昆仑芯已全面拥抱最大的大模型开源社区HuggingFace,打造了xHuggingface开源推理套件,并携手飞桨等生态伙伴构建软硬一体的AI芯片生态。

  当前,大模型的技术生态正快速发展,驱动产业实践、行业创新应用,而这离不开AI产业链各企业的加持。在圆桌论坛环节,漆维与同台专家、优秀企业家代表围绕“大模型创新发展之路”展开深入探讨。

  漆维表示:“大模型技术的发展为国内AI芯片企业带来了良好的前景,但也带来了算力需求及成本的挑战。昆仑芯始终坚持开拓创新,降低AI算力成本与使用门槛,加强与AI产业链上下游企业的合作,为市场提供更优质的产品和服务。目前,已有两代昆仑芯AI芯片实现量产和规模部署,而在研的下一代产品将为大模型和AIGC等应用提供更佳的性能体验。”

  AI算力正成为数字基建的新抓手,以及制约大模型技术发展的关键要素。作为AI芯片领域的领军企业,昆仑芯将继续秉承“让计算更智能”的使命,打造更高性能的芯片产品,提供更普惠的AI算力,携手生态伙伴领跑大模型产业落地。

  关于昆仑芯

  昆仑芯前身为百度智能芯片及架构部,于2021年4月完成独立融资,首轮估值约130亿元。核心团队在国内最早布局AI加速领域,深耕十余年,是一家在体系结构、芯片实现、软件系统和场景应用均有深厚积累的AI芯片企业。

  秉承着“让计算更智能”的使命,昆仑芯专注打造拥有强大通用性、易用性和高性能的通用AI芯片。目前,昆仑芯已实现两代通用AI芯片系列产品的量产及落地应用,在互联网、智慧工业、智慧交通、智慧金融等领域均有规模部署,帮助企业加速产业智能化布局,将AI算力赋能千行百业。如需选购昆仑芯产品,欢迎咨询AMEYA360商城在线客服!

(备注:文章来源于网络,信息仅供参考,不代表本网站观点,如有侵权请联系删除!)

在线留言询价

相关阅读
昆仑芯Day 0极速适配商汤日日新SenseNova U1模型
  4月28日,商汤正式发布并开源原生理解生成统一模型——商汤日日新SenseNova U1系列。在模型发布当日,昆仑芯即完成对SenseNova U1的极速适配,成为率先完成该模型适配的国产算力厂商之一。  SenseNova U1系列模型能够将语言与视觉信息作为统一的复合体直接建模,实现语言和视觉信息的高效协同,让理解与生成能力同步增强,在保留语义丰富度的同时,维持像素级的视觉保真度。在逻辑推理与空间智能等方向上,它能够深度理解物理世界的复杂布局与精细关系;在未来,它还能为机器人提供具身大脑,实现在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行的全过程,为推动技术与产业发展提供重要基础与关键引擎。  SenseNova U1是基于统一表征空间构建的,更像是一个从一开始就同时掌握多项技能的人。它不是先看懂图像、再翻译成文字、再交给另一个系统理解,而是在同一套“思考方式”里直接处理图像、文字等不同信息。图像和语言不再是两套系统之间的接力,而是在同一个大脑中自然融合。能力表现上,在涵盖图像理解、图像生成与编辑、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模型SOTA水平,为统一多模态理解与生成树立了新的标杆。仅凭8B-MoT的较小规格,就能达到乃至超越部分大型商业闭源模型。  在实际适配过程中,昆仑芯依托自研架构,持续完善算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,SenseNova U1已在昆仑芯平台上实现高吞吐、低延迟的稳定运行,在复杂任务与长序列场景中依然保持优异表现。针对图文交错生成、高密度信息图生成等应用,昆仑芯对其进行专项调优,实现了高效、高精度的推理性能,让开发者和企业无需复杂的底层适配与性能调优,即可完整调用模型能力。  高效适配的背后,是昆仑芯自研软件栈的出色兼容性与适配能力。为全面释放产品性能,昆仑芯已构建面向开发者的软件栈,并提供从底层驱动到专用库的完备能力,全面覆盖模型开发与部署关键环节。该软件栈高度兼容主流AI开发生态,在保障计算性能充分释放的同时,有效降低开发门槛与模型迁移成本,使客户能够以更低的适应成本与更短的部署周期完成AI模型开发与部署落地,加速从研发到应用的转化。  近期,国产大模型生态迎来密集升级,技术突破与产业落地节奏持续提速。昆仑芯当前已完成对多款主流大模型的首发适配,稳步实现 “发布即支持”的快速落地能力,推动模型技术迭代与算力底座同频演进,充分展现其在软硬协同、生态兼容与工程化落地方面的综合实力。这一核心能力,不仅有效降低模型部署与应用门槛,更助力AI应用规模化拓展,持续领跑国产算力生态适配进度。  国产算力的高效适配能力,正成为大模型规模化落地的关键支撑。面向未来,昆仑芯将通过持续的性能优化与架构迭代,不断刷新国产大模型在国产硬件上的运行表现。依托持续的技术创新与软硬协同优势,昆仑芯将持续夯实国产AI算力底座,助力产业智能化升级与数字化转型加速推进,共绘国产AI发展新蓝图。
2026-04-29 09:42 阅读量:285
Day 0适配Xiaomi MiMo-V2.5-Pro,昆仑芯持续加速国产大模型落地
  今日,小米正式发布并开源MiMo-V2.5-Pro模型。昆仑芯在发布当日即完成对MiMo-V2.5-Pro的极速适配,成为首批实现适配的国产算力厂商之一,再次验证其在主流大模型生态中的敏捷响应能力与广泛兼容能力。  据悉,MiMo-V2.5-Pro是小米迄今最强大的模型,可支撑MiMo-V2.5-Pro的1T超大参数量、以及1M 超长上下文的高吞吐推理。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖Agent模型(Claude Opus4.6、GPT-5.4等)正面较量,相较上一代MiMo-V2-Pro实现了全方位跃升。此外,该模型在Agent场景下的指令遵循能力也明显提升——既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。适用于大型项目编程、数据分析等企业级应用场景,也适用于接入OpenClaw、Hermes Agent、Claude Code等Agent框架。  在实际适配过程中,昆仑芯依托自研架构,持续提升算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,MiMo-V2.5-Pro已在昆仑芯平台上实现高吞吐、低延迟的稳定运行,并在复杂任务与长序列场景中保持优异表现,使开发者与企业用户能够实现“零成本迁移、即部署即用”。  此次高效适配的背后,是昆仑芯在软硬件协同方面的长期深耕。为充分释放产品性能,昆仑芯构建了面向开发者的全栈软件体系,完整覆盖从底层驱动到开发工具SDK及专业库,兼顾高效易用与工程化落地。昆仑芯软件栈高度兼容主流AI开发生态,在显著降低开发门槛的同时,最大化释放计算性能,帮助客户以更低适配成本和更短部署周期完成模型开发与落地,加速模型从研发到应用的转化。本次Day 0适配,标志着昆仑芯与Xiaomi MiMo在“国产算力+国产大模型”协同发展路径上进一步深化,也为全球AI生态的开放与繁荣注入新的动能。近期,国产大模型生态持续演进,技术突破与产业落地节奏显著加快。在此背景下,昆仑芯已构建起体系化、高效率的模型适配能力,能够快速响应主流模型的迭代升级。目前已全面覆盖MiniMax、智谱、通义千问等头部厂商的最新旗舰模型,能力横跨语言、多模态、OCR与文生图等关键方向。当前,昆仑芯正持续深化模型适配与性能优化能力,全面支持多样化模型架构与算法创新,不断提升开发与部署效率。面向未来,将持续深耕全栈技术研发,强化软硬协同与生态共建,不断夯实国产AI算力底座,为国产AI的高质量发展提供源源不断的算力动能。
2026-04-29 09:27 阅读量:278
昆仑芯全面支撑中国移动九天35B大模型,国产AI方案加速落地
  近日获悉,中国移动即将正式发布一款自主研发的九天35B通用大模型。作为央企自研大模型的标杆之作,九天35B凭借强大的语言理解、复杂推理与行业场景适配能力,为通信、政务、金融等行业数智化转型提供了坚实的AI底座。  作为中国移动“AI能力联合舰队” 核心算力伙伴,昆仑芯在当前已完成对九天35B模型的全流程适配与推理验证。依托昆仑芯P800硬件加速能力及成熟的软件栈,模型得以在国产算力平台上实现高性能、低显存占用的稳定运行,为中移九天大模型的规模化部署提供了坚实支撑。中移九天大模型作为中国移动“九天”体系的核心基座产品,具备高安全、高可控、全自主的央企级能力,已通过生成式AI服务双备案及A级安全认证,并在多类数智化场景中实现广泛适配。此次完成九天35B模型的快速适配,不仅体现了昆仑芯在软件生态成熟度与工程化响应效率上的持续提升,也进一步构建起“国产算力 + 国产大模型”的全栈国产化解决方案。在关键技术层面,昆仑芯围绕注意力机制优化与长序列推理进行了深度适配,有效提升模型执行效率与稳定性,充分满足通信、政务、金融等行业对低时延、高可靠AI部署的实际需求。在软件生态方面,昆仑芯现已构建了覆盖底层驱动、SDK至专业库的全栈软件体系,高度兼容主流AI开发生态,有效降低开发门槛与模型迁移成本。目前,昆仑芯已实现国内外多款主流大模型的发布当日即适配,并持续完善模型部署能力,助力开发者以更低的适应成本、更短的部署周期完成AI应用开发。在基础设施层面,作为中国移动的重要生态伙伴,昆仑芯已深度参与中国移动云智算中心及万卡级集群建设,持续推动算力基础设施向规模化、体系化演进。未来,昆仑芯将持续深耕技术研发,强化软硬协同与生态共建。凭借开放兼容的软件生态与强劲高效的硬件底座,昆仑芯将与中国移动在模型训练、推理优化及行业场景适配等方向深化合作,推动国产算力与央企大模型深度融合,加速AI能力在真实产业场景中的规模化落地,赋能千行百业智能化升级。
2026-04-27 09:57 阅读量:357
Day 0支持|昆仑芯完成MiniMax M2.7模型极速适配
  MiniMax正式开源MiniMax M2.7模型。昆仑芯同步完成对该模型的Day 0适配与深度优化,成为首批实现适配的国产算力厂商之一,再次验证其在主流大模型生态中的敏捷响应能力与广泛兼容能力。  发布即适配,软硬协同支撑高效落地  MiniMax M2.7是M2系列的最新一代模型,也是首个深度参与自身迭代的版本。该模型具备自主构建复杂Agent Harness与Skills的能力,可动态更新Memory,并通过强化学习持续优化,实现“模型驱动模型进化”的闭环。在能力表现上,M2.7已覆盖从代码生成、日志排障到端到端项目交付的完整软件工程链路:SWE-Pro基准达到56.22%,整体表现追平GPT-5.3-Codex;在专业办公场景中,GDPval-AA评分位居行业前列,并在40个复杂Skills(>2000 Token)任务中保持97%的指令遵循率,展现出优异的稳定性与执行能力。  在实际适配过程中,昆仑芯依托自研架构,持续提升算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过底层算子优化与软硬件协同加速,MiniMax M2.7已在昆仑芯平台上实现高吞吐、低延迟的稳定运行,并在复杂任务与长序列场景下保持优异表现。  为充分释放产品性能,昆仑芯构建了面向开发者的全栈软件体系,完整覆盖从底层驱动到开发工具SDK及专业库的完整能力,兼顾高效易用与工程化落地。该软件栈高度兼容主流AI开发生态,在显著降低开发门槛的同时,最大化释放计算性能,帮助客户以更低适配成本和更短部署周期完成模型开发与落地,加速模型从研发到应用的转化。  常态化Day 0响应,夯实国产AI算力底座  近期,国产大模型生态迎来密集升级,技术突破与产业落地节奏持续加快。昆仑芯已完成对多款主流大模型的首发适配,稳步实现“发布即支持”的快速落地能力,推动模型技术迭代与算力底座实现同频演进,充分体现其在软硬协同、生态兼容与工程化落地方面的综合实力。同时,该能力有效降低了模型部署与应用门槛,进一步加快AI应用的规模化拓展。  当前,昆仑芯正持续深化模型适配与性能优化能力,全面支持多样化架构与算法创新,不断提升开发与部署效率。面向未来,昆仑芯将进一步强化对主流前沿模型的高效适配能力,依托持续的技术创新与软硬协同优势,不断夯实国产AI算力底座,助力产业智能化升级与数字化转型加速推进。
2026-04-13 09:30 阅读量:440
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
CDZVT2R20B ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
BD71847AMWV-E2 ROHM Semiconductor
TL431ACLPR Texas Instruments
MC33074DR2G onsemi
型号 品牌 抢购
IPZ40N04S5L4R8ATMA1 Infineon Technologies
TPS63050YFFR Texas Instruments
ESR03EZPJ151 ROHM Semiconductor
BP3621 ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
BU33JA2MNVX-CTL ROHM Semiconductor
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360微信服务号 AMEYA360微信服务号
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。

请输入下方图片中的验证码:

验证码