微软称使用数万数英伟达芯片,总额达数亿美元为OpenAI

发布时间:2023-03-14 11:35
作者:AMEYA360
来源:网络
阅读量:2677

  美国当地时间周一,微软发文透露称为其斥资数亿美元帮助 OpenAI 组装了一台 AI 超级计算机,以帮助开发爆火的聊天机器人 ChatGPT。这台超算使用了数万个英伟达图形芯片 A100,这使得 OpenAI 能够训练越来越强大的 AI 模型。

  OpenAI 试图训练越来越大的 AI 模型,这些模型正在吸收更多的数据,学习越来越多的参数,这些参数是 AI 系统通过训练和再培训找出的变量。这意味着,OpenAI 需要很长时间才能获得强大的云计算服务支持。

微软称使用数万数英伟达芯片,总额达数亿美元为OpenAI

  为应对这一挑战,当微软于 2019 年向 OpenAI 投资 10 亿美元时,该公司同意为这家 AI 研究初创公司组装一台巨大的尖端超级计算机。但问题在于,微软没有任何 OpenAI 所需的东西,也不完全确定其能否能在不破坏 Azure 云服务的情况下构建如此庞大的设备。

  为此,微软不得不想方设法将英伟达的数万个 A100 图形芯片连接起来,并改变服务器在机架上的放置方式以防止断电。A100 图形芯片是培训 AI 模型的主力。微软负责云计算和 AI 业务的执行副总裁斯科特 · 格思里(Scott Guthrie)没有透露该项目的具体成本,但其暗示可能达数亿美元。

  微软 Azure AI 基础设施总经理尼迪 · 卡佩尔(Nidhi Cappell)说:" 我们构建了一个系统构架,它可以在非常大的范围内运行且十分可靠,这是 ChatGPT 成功的重要原因。这只是我们从中得出的一个模式,还会有许许多多其他的模型。"

  基于这项技术,OpenAI 发布了爆火的聊天机器人 ChatGPT。在去年 11 月上线后几天,它就吸引了 100 多万用户,现在正被纳入其他公司的商业模式。随着企业和消费者对 ChatGPT 等生成式人工智能(AIGC)工具的兴趣越来越大,微软、亚马逊和谷歌等云服务提供商将面临更大的压力,以确保他们的数据中心能够提供所需的巨大算力。

  与此同时,微软现在也开始使用它为 OpenAI 构建的基础设施来训练和运行自己的大型 AI 模型,包括上个月推出的新必应搜索聊天机器人。该公司还向其他客户销售该系统。这家软件巨头已经在研发下一代 AI 超级计算机,这是微软与 OpenAI 扩大合作的一部分,微软在交易中增加了 100 亿美元投资。

  格思里在接受采访时说:" 我们并没有为 OpenAI 定制任何东西,尽管其最初是定制的,但我们总是以一种泛化的方式构建它,这样任何想要训练大型语言模型的人都可以利用同样的改进技术。这真的帮助我们在更广泛的范围内成为更好的 AI 智能云。"

  训练规模庞大的 AI 模型需要在某个地方有大量相互连接的图形处理单元,就像微软组装的 AI 超级计算机那样。一旦模型投入使用,回答用户查询的所有问题(这个过程称为推理)需要略有不同的设置。为此,微软还部署了用于推理的图形芯片,但这些处理器(成千上万个)在地理上分散在该公司 60 多个数据中心里。微软表示,现在该公司正在添加用于 AI 工作负载的最新英伟达图形芯片 H100 以及最新版 Infiniband 网络技术,以更快地共享数据。

  新的必应仍处于测试阶段,微软正在逐步从申请测试名单中增加更多用户。格思里的团队与大约 20 多名员工每天都要举行会议,他将这些员工称为 "pit crew",原指赛车中车队后勤维护组的技师。这些人的工作是找出如何让更多的计算能力快速上线,以及解决突然出现的问题。

  云服务依赖于数千个不同的部件,包括服务器、管道、建筑物的混凝土、不同的金属和矿物,而任何一个组件的延迟或短缺,无论多么微小,都可能导致整个项目中断。最近,"pit crew" 团队不得不帮助解决电缆托盘短缺的问题,这是一种篮状的装置,用来固定从机器上顺下来的电缆。因此,他们设计了一种新的电缆桥架。格思里说,他们还致力于研究如何在世界各地的现有数据中心压榨尽可能多的服务器,这样他们就不必等待新的建筑竣工。

  当 OpenAI 或微软开始训练大型 AI 模型时,这项工作需要一次完成。工作被分配给所有的 GPU,在某些时候,这些 GPU 需要相互交流来分享他们所做的工作。对于 AI 超级计算机,微软必须确保处理所有芯片之间通信的网络设备能够处理这种负载,并且它必须开发出最大限度地利用 GPU 和网络设备的软件。该公司现在已经开发出一种软件,可以用来训练数十万亿个参数的 AI 模型。

  因为所有机器都是同时启动的,微软不得不考虑安放它们的位置,以及电源该应该放在哪里。否则,数据中心最终可能会断电。Azure 全球基础设施总监阿利斯泰尔 · 斯皮尔斯(Alistair Speirs)说,微软还必须确保能够冷却所有这些机器和芯片,该公司在较凉爽的气候中使用蒸发;冷却方式、在较冷的气候中使用室外空气,在炎热的气候中使用高科技沼泽冷却器。

  格思里说,微软将继续致力于定制服务器和芯片设计,以及优化供应链的方法,以尽可能地提高速度、提高效率和节省成本。他说:" 现在令世界惊叹的 AI 模型是基于我们几年前开始建造的超级计算机构建的,而新模型将使用我们现在正在训练的新超级计算机。这台计算机要大得多,可以实现更复杂的技术。"

  微软已经在努力使 Azure 的 AI 功能更加强大,推出了新的虚拟机,使用英伟达的 H100 和 A100 Tensor Core GPU,以及 Quantum-2 InfiniBand 网络。微软表示,这将允许 OpenAI 和其他依赖 Azure 的公司训练更大、更复杂的 AI 模型。

  微软 Azure AI 企业副总裁埃里克 · 博伊德(Eric Boyd)在一份声明中说:" 我们发现,我们需要构建专门的集群,专注于支持大量的培训工作,而 OpenAI 就是早期的证据之一。我们正与他们密切合作,了解他们在建立训练环境时需要的关键条件,以及他们需要的其他东西。"


(备注:文章来源于网络,信息仅供参考,不代表本网站观点,如有侵权请联系删除!)

在线留言询价

相关阅读
微软要求中国员工只能用iPhone!
  7月9日消息,据外媒报道,微软近日已告知其中国员工,从今年9月份开始,他们在工作中只能使用iPhone。  此举实际上将安卓设备排除在了工作场所之外,也是属于微软全球安全未来计划的一部分,将影响中国大陆的所有员工,旨在确保员工都使用微软Authenticator密码管理器和Identity Pass 身份验证应用。  备忘录称,任何使用安卓手机(包括华为或小米手机)的微软员工都将获得一部iPhone15。微软将在中国各地的多个中心提供iPhone供员工领取,包括中国香港地区。  为何微软会选择iPhone作为唯一的工作手机?这背后有着深刻的技术与市场考量。据知名博主分析,主要原因在于中国大陆市场的特殊性——谷歌服务的缺失。谷歌移动服务(GMS)是Android生态中不可或缺的一环,它为众多应用提供了鉴权、推送等核心功能。然而,在中国大陆GMS无法正常使用,这直接导致了基于GMS的应用在安卓设备上的兼容性问题。  具体到微软Authenticator密码管理器,该应用依赖于GMS进行鉴权,以确保用户身份的安全验证。在GMS缺失的环境下,Authenticator无法在基于Android Open Source Project(AOSP)的系统中正常工作,这为微软员工的工作带来诸多不便和安全隐患。  对此,有网友还按照上述答案专门测试了下,给出的说法是:“我刚测试了一下。Authenticator需要gms鉴权,由于gms无法在中国大陆使用,所以在国内aosp的os中无法使用。”。
2024-07-09 14:19 阅读量:340
微软发布Copilot+ PC:首发骁龙X平台,性能提升80%,续航提升近一倍!
  北京时间5月21日凌晨,在微软一年一度的Build开发者大会的前一天,微软召开发布会,抢先发布了其与合作伙伴专为AI设计的,基于高通Snapdragon X系列处理器的一系列Windows PC新品,其中就包括了微软自家的Surface混合形态笔记本电脑。  微软将这类支持端侧生成式AI的产品称之为“Copilot+ PC”,其不仅在性能上优于部分英特尔Core Ultra处理器和基于M3处理器的苹果Macbook Air,还展示了其支持端侧生成式AI的能力。  据介绍,微软“Copilot+ PC”是对于带有NPU(Neural Processing Unit)内核及微软AI助手Copilot的Windows PC新称号。微软将结合CPU、GPU及NPU强大性能,建构一套全新系统架构。根据微软的定义,Copilot+ PC至少需要16GB內存、256GB SSD,整合NPU的性能需要达到40 TOPS以上、可以在端侧运行最先进AI模型、具备全天的电池续航力。  在性能方面,此前的数据显示,高通Snapdragon X Elite处理器在Geekbench与Cinebench性能基准测试中多次击败基于M3处理器的MacBook Air,并且还在多项基准测试中击败了英特尔Core Ultra 7 155H。  微软也宣称,基于高通Snapdragon X系列平台的“Copilot+ PC”性能将比搭载M3芯片的15英寸MacBook Air高出58%。  微软还表示,其新款的Surface Pro、Surface Laptop会将英特尔Core Ultra处理器换成高通Snapdragon X Elite、Snapdragon X Plus处理器,并表示这将比之前版本速度提升80%以上。新Surface Pro还将首次配备OLED屏幕。  在端侧AI能力方面,微软在Arm版Windows 11中内置了40多个AI模型,其中十个是后台运行的小语言模型(SLM),供开发者调用,续航测试场景包括这些始终在后台运行的SLM。  这类“Copilot+ PC”可以带来出色的端侧AI体验,比如可通过“回顾”(Recall)找出此前在PC上看过的内容;借助即时字幕功能可突破语言障碍,这项新功能可将中文在内40多种语言即时翻译成英文字幕。  由于高通Snapdragon X系列处理器是基于Arm指令集架构的,因此应用软件的兼容性一直是用户关心的问题,这也是多年来基于Arm架构的Windows PC一直不温不火的关键原因(微软早在2012年就推出了Surface RT,此后高通也曾持续携手合作伙伴推出基于骁龙平台的Windows PC)。  对此,微软表示,目前Windows on Arm已经有87%的应用是Arm原生应用,仅剩13%需要用到兼容层转译。微软也推出了Prism模拟器,号称转译效率是旧款的两倍。  确实,目前Photoshop、Dropbox、Zoom、Spotify、Amazon Prime、Hulu等许多知名应用均有Arm 64位原生版本,并且以Chrome、Edge、Firefox为首的网络浏览器均有相应的原生Arm原生版本。特别是近几年来,随着基于Arm架构的苹果Mac产品大卖,各类应用确实正在向Arm生态转移或主动兼容。而在生成式AI加速向智能手机、PC等端侧设备渗透的大趋势之下,将会进一步推动各类AI应用开发商加入对于Arm生态的支持。  据微软介绍,Copilot+ PC也将受益于Adobe、DaVinci Resolve、CapCut、Cephable、LiquidText及djay Pro的AI功能。  在续航方面,得益于Arm处理器的高能效特性,续航能力一直是Arm PC的主打优势。微软表示,基于高通Snapdragon X平台的“Copilot+ PC”拥有令人印象深刻的功耗表现,单次充电可支持长达22小时视频播放或15小时网页浏览。相比之下,基于X86平台的2022款Surface Laptop 5的续航只支持8小时38分钟网页浏览或与12小时30分钟的视频播放,等于是续航能力提升了近一倍。  除了微软的新款Surface设备之外,联想、惠普、戴尔、三星、宏碁、华硕都将会推出一系列Copilot+ PC产品,这些新机已经抢先搭载Arm构架的高通Snapdragon X Elite、Snapdragon X Plus处理器。  今年稍晚也将有采用英特尔和AMD处理器的Copilot+ PC产品推出。微软预估明年“Copilot+ PC”的笔记本电脑出货量将达5,000万台。
2024-05-21 14:43 阅读量:959
微软新专利披露一款高效便携式音箱
为什么中国仍是微软的战略市场?
俄媒报道,美国微软公司近日表示,中国市场仍然是公司的战略市场。去年外国公司对中国市场的兴趣比以往任何时候都更大。中国公司在争取打入世界市场,但外国科技公司却相反,都在向微软公司咨询,最好携带何种产品进入中国。  据俄罗斯卫星网11月20日报道,从历史上来看,微软公司和中国结下了紧密的关系。微软公司1998年在中国开设海外研究院,这是微软首次在亚洲国家设立研究院。此前微软公司有两个实验室:一个位于美国,另一个位于英国。  报道指出,微软公司在北京寻找有才能的工程师的决定没有失算。在微软亚洲研究院运行期间,实验室的学者们产出1500多项论文,发布在世界各大主流科技杂志上。  微软公司北京实验室的研究成果也应用在了微软公司所有关键产品中:Windows、Office、Bing、Xbox、Kinect和Windows Phone。  北京实验室所开发的各项技术奠定了MPEG4格式视频编码国际标准、TCP/IP IETF标题压缩方法,以及ITU/ISO制定的视频压缩标准编码的基础。  报道认为,放弃与中国的长期合作,对微软公司来说完全没有好处。北京实验室主抓的那些研究领域是中国一直以来的强项,其中包括:大数据分析,并在此基础上制定算法;利用机器学习技术优化搜索引擎服务和投放上下文广告;开发自然用户界面让人利用言语、姿势和情绪与小机器互动。
2019-11-25 00:00 阅读量:1634
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
RB751G-40T2R ROHM Semiconductor
TL431ACLPR Texas Instruments
MC33074DR2G onsemi
CDZVT2R20B ROHM Semiconductor
BD71847AMWV-E2 ROHM Semiconductor
型号 品牌 抢购
BU33JA2MNVX-CTL ROHM Semiconductor
ESR03EZPJ151 ROHM Semiconductor
IPZ40N04S5L4R8ATMA1 Infineon Technologies
TPS63050YFFR Texas Instruments
BP3621 ROHM Semiconductor
STM32F429IGT6 STMicroelectronics
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360微信服务号 AMEYA360微信服务号
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。