NVIDIA 为1亿台Windows RTX PC 和工作站提供全新生成式 AI功能与突破性性能

发布时间:2023-05-31 10:18
作者:AMEYA360
来源:网路
阅读量:1722

  搭载 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的开发与部署;即将推出的 Max-Q 低功耗 AI 推理将提高能效比。生成式 AI 正在迅速开创一个计算的新时代,为生产力、内容创作、游戏等多领域带来了变革。NVIDIA NeMo 和 DLSS 3 帧生成技术、Meta LLaMa、ChatGPT、Adobe Firefly、Stable Diffusion 等生成式 AI 模型和应用能够使用神经网络来识别现有数据中的模式和结构,以此生成新的原创内容。

NVIDIA 为1亿台Windows RTX PC 和工作站提供全新生成式 AI功能与突破性性能

  专为 GeForce RTX 和 NVIDIA RTX GPU 优化的生成式 AI 模型具有高达 1,400 Tensor TFLOP 的 AI 推理性能,运行速度比同类其他设备快 5 倍。这要得益于 RTX GPU 中用于加速 AI 计算的专用硬件 Tensor Cores,以及常规的软件改进。上周在 Microsoft Build 大会上发布的增强功能等软件方面的改进使得像 Stable Diffusion 这样充分利用新的 DirectML 优化功能的生成式 AI 模型性能翻倍。

  随着越来越多的 AI 推理在本地设备上运行,PC 将需要强大而高效的硬件以支持这些复杂的任务。为了满足这一需求,RTX GPU 将添加用于 AI 工作负载的 Max-Q 低功耗推理。在执行轻量级的推理任务时,GPU 将以极低的功耗运行,而在运行繁重负载如生成式 AI 工作时,则可升至极高的性能水平。

  为了创建新的 AI 应用,在 Windows 11 上运行的整个 RTX 加速 AI 开发堆栈现已向开发者开放,使 AI 模型的开发、训练和部署变得更容易。开发者首先会通过Windows Subsystem for Linux(WSL)上经过优化的深度学习框架开发和微调模型。

  然后开发者可以无缝上云并在各个主要云服务商(CSP)提供的相同 NVIDIA AI 堆栈上进行训练。接下来,开发者使用全新 Microsoft Olive 等工具优化训练好的模型以实现快速推理,最后面向专为 AI 优化的系统的 1 亿多 RTX PC 和工作站部署 AI 应用和功能。

  微软 Windows 芯片和系统集成副总裁 Pavan Davuluri 表示:“未来几年,AI 将成为推动 Windows 客户创新的最大驱动力。我们正在与 NVIDIA 开展软硬件优化方面的合作,以此为开发者提供变革性的、高性能的、易于部署的体验。”

  迄今为止,超过 400 款已发布的应用和游戏由 RTX AI 提供加速,该阵容还在持续壮大中。

  在拉开了 Computex 2023 序幕的主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋介绍了用于游戏开发的新生成式 AI——NVIDIA ACE 游戏开发版(NVIDIA Avatar Cloud Engine (ACE) for Games)。

  通过 AI 驱动的自然语言互动,这项自定义 AI 模型代工服务使游戏中的非玩家角色(NPC)更加智能,从而彻底改变游戏体验。中间件、工具和游戏开发者可以使用 “ACE 游戏开发版(ACE for Games)” 在他们的软件和游戏中建立并部署定制化的语音、对话和动画 AI 模型。

  在 RTX 上运行的生成式 AI 无处不在

  从服务器到云,再到设备,在 RTX GPU 上运行的生成式 AI 无处不在。NVIDIA 的加速 AI 计算具有低时延、全栈式的特点。多年来,我们一直在优化 AI 软硬件架构的各个部分,包括 RTX GPU 上的专用 AI 硬件——第四代 Tensor Core。

  通过对驱动的定期优化,能够确保峰值性能。最新 NVIDIA 驱动在与经 Olive 优化的模型和 DirectML 更新结合后,能够在 Windows 11 上大幅提升开发者的速度。例如在 Stable Diffusion 中,使用 DirectML 优化路径的开发者将干扰时间缩短了两倍。

  借助基于 NVIDIA Ada Lovelace 架构打造的最新一代 RTX 笔记本电脑和移动工作站,用户可以在任何地方运行生成式 AI。新一代移动平台的外形尺寸只有 14 英寸,重量仅为 3 磅左右,将性能和便携性提升至新高。戴尔、惠普、联想、华硕等制造商正在 RTX GPU 和 Tensor Cores 的支持下,推动生成式 AI 时代的发展。

  “随着各个行业继续部署 AI,预计到 2030 年,AI 需求的年增长率将超过 37%,企业和消费者将越来越需要合适的技术以实现 AI 的开发和落地,比如生成式 AI 等。多年来,联想一直致力于开发适用于 AI 工作负载的产品和解决方案,进而助力扩展生成式 AI 的应用范围——从设备到服务器、再到云。联想 ThinkPad、ThinkStation、ThinkBook、Yoga、Legion 和 LOQ 等搭载 NVIDIA RTX GPU 的 PC 正在推动生成式 AI 的变革浪潮,在节省时间、创作内容、完成工作和游戏等方面提供更好的用户体验。”

  ——联想副总裁兼 PC 业务和智能设备首席技术官 Daryl Cromer

  “生成式 AI 是一项革命性的技术,同时也是促进各个行业未来创新的催化剂。惠普与 NVIDIA 共同为开发者提供卓越的性能、移动性以及运行当前加速 AI 模型所需的可靠性,推动全新生成式 AI 时代的发展。”

  ——惠普高级副总裁兼 Z 系列总经理 Jim Nottingham

  “我们近期与 NVIDIA 围绕 Project Helix 的合作重点是助力企业更轻松地在本地构建和部署值得信赖的生成式 AI。在这个历史性时刻,我们进一步将生成式 AI 引入 PC 。想象一下,应用开发者能够在完善神经网络算法的同时,在本地控制训练数据和 IP。正是为了实现这个目标,我们设计了搭载 NVIDIA RTX GPU 的强大、可扩展 Precision 工作站。作为工作站领域的全球领导者,戴尔在帮助用户安全加速从边缘到数据中心的 AI 应用方面具有独特的优势。”

  ——戴尔科技客户产品部总裁 Ed Ward

  “生成式 AI 的时代正在到来,因此需要强大的处理能力和经过全面优化的软硬件。借助 NVIDIA AI 平台,包括现在已经预装到我们许多产品上的 NVIDIA Omniverse,我们十分高兴能看到 AI 的变革在华硕和 ROG 笔记本电脑上持续不断地推动着。”

  ——华硕全球消费业务市场总监 Galip Fu

  很快,搭载 RTX GPU 的笔记本电脑和移动工作站就将做到“两全其美”。纯 AI 推理工作负载将根据 Tensor Core 的性能进行优化,同时尽可能降低 GPU 的功耗,延长电池续航时间,并保持系统拥有出色的散热和降噪表现。GPU 还可根据工作负载的需要,动态提升至最高 AI 性能。


(备注:文章来源于网络,信息仅供参考,不代表本网站观点,如有侵权请联系删除!)

在线留言询价

相关阅读
两款国产5nm AI芯片,2026年前量产!
  据知情人士透露,TikTok母公司字节跳动正加快自研人工智能芯片的步伐,意在提升在中国人工智能聊天机器人市场中的竞争优势。  两位知情人士证实,字节跳动计划与芯片制造巨头台积电合作,力争在2026年前实现两款自研半导体芯片的量产,使用5纳米技术。这一举措可能会减少字节跳动在开发和运行人工智能模型过程中对昂贵的英伟达芯片的依赖。  对于字节跳动来说,降低芯片成本至关重要。与其他中国大型科技公司及众多初创企业一样,字节跳动已经推出了自家大语言模型,供内部使用和对外销售。然而,市场竞争异常激烈,导致包括阿里巴巴和百度在内的中国科技巨头纷纷将其模型使用价格大幅下调,降幅高达97%。  字节跳动去年发布了其首款人工智能聊天机器人“豆包”,该机器人提供了类似于OpenAI ChatGPT的文本和图像生成功能。今年,字节跳动又推出了一批低成本的大语言模型,其中部分产品的定价比OpenAI的同类产品低了高达99%。  与此同时,字节跳动在开发生成式人工智能模型方面的费用也在不断上升。据知情人士透露,今年,该公司已订购了超过20万颗英伟达H20芯片,这款芯片是美国出口管制下允许出售给中国的最先进英伟达芯片。该订单的总金额超过20亿美元,目前字节跳动仍在等待英伟达交付全部订单。  不过,字节跳动正计划从台积电订购数十万颗自家设计的训练和推理芯片。预计这些内部设计的芯片成本将比从英伟达购买芯片节省数十亿美元。然而,这些芯片目前仍处于设计阶段,因此字节跳动的计划可能会有所调整。
2024-09-18 16:33 阅读量:534
AI在可穿戴领域狂飙,混合式AI模式加速落地
  随着技术的发展,硬件升级为智能硬件,增加了CPU、操作系统,还增加了联网、健康监测等功能。AI技术的应用,又让智能硬件的普通AI升级为生成式AI。当下,我们对生成式AI并不陌生,它带来了更加个性化的推荐和更加人性化的交互方式。       在可穿戴设备上,苹果、三星、360、索尼、XREAL等做智能手表、XR设备的硬件厂商都将生成式AI用到了自己的产品上。在产业链上游,涉及处理器、传感器的芯片厂商在生成式AI与可穿戴设备越来越紧密的过程中,得到了新的机会。  AI迭代方向:从传统AI转向生成式AI、多模态  360集团创始人周鸿祎认为未来有两种硬件,一种是硬件+AI,另一种是硬件+AI的进化版:AI-Native硬件。第一种是传统的智能硬件,第二种是AI Native硬件,AI大模型是核心功能,例如人形机器人、自动驾驶、AI PC、新型AI 硬件等。       从某种意义上看,现阶段智能硬件正在从传统AI走向生成式AI,大模型将在C端找到更适合的应用场景。       “2024年是大模型应用场景之年,To C出现杀手级应用”,周鸿祎预判。多模态大模型+智能硬件才能深入更多应用场景。那么,多模态指的是什么,大模型需要怎么样的硬件呢?       多模态能力指的是可穿戴设备利用健康监测传感器获取的多种信息,例如声音、手势、心率、心电图、体温、定位等数据。在大模型的加持下,利用AI技术能够将这些单一的数据进行不同维度的整合,生成新的维度、个性化的数据。       至于在硬件上,可穿戴设备领域已经推出了多种不同类型的产品,智能手表/手环、无线耳机、AR/VR设备、AI Pin、智能戒指等。       基于不同的应用场景及需求,智能手表成为生成式AI落地最为快速的可穿戴设备品类之一。这是因为它能提供更多生成式AI需要的数据。从2023年至今,已经有多家厂商宣布要在自家的智能手表里植入云生成式AI,这些厂商包括Zepp Health、谷歌 (Fitbit)、三星、苹果、Whoop、360等。       生成式AI在智能手表市场上带来两大作用,一是生成式AI的加入提升了健康监测数据的准确性与相关性,产品迭代让厂商在激烈的市场竞争中获得先机。二是生成式AI成为“解救”智能手表市场增长缓慢的一剂良药,也成为健康监测和其他智能功能升级之外刺激消费者购买的动力。       如果说2023年,智能手表市场的增长是得益于eSIM、卫星通信加持,以及蓝牙、UWB技术提升。那么可以预测,在2024年,生成式AI的加入将是智能手表市场持续增长的关键之一,特别是高端智能手表市场。Canalys预测,在AI功能的带动下,2025年全球智能手表出货量增幅约为20%。       不同于传统AI,生成式AI通过学习和理解大量数据,自动生成新内容或解决新问题,具有更强的创造性和适应性。在可穿戴设备上,尤其是具备健康监测功能的可穿戴设备上,能够提供个性化的健康建议,或者在运动场景制定个性化的运动计划,在日常生活中提供个性化的服务。       在可穿戴设备里,XR厂商也在寻找AR/VR+AI的最佳契合点。高通技术公司 XR 产品管理高级总监 Said Bakadir认为:与生成式 AI 的最佳互动方式就是 XR。这是不同于苹果、三星的AI功能又一应用方向。       在AWE XR 展会上,AR 眼镜技术商 DigiLens宣布ARGO 眼镜将集成谷歌 Gemini 大模型,能够用于语音交互等功能。值得一提的是,AI结合智能眼镜传感器,可以感知佩戴者的环境、意图等。还能够基于应用场景,提供导航辅助等专业任务可视化效果。       就在近期,外媒爆料了苹果正在计划的全新智能眼镜产品相关细节,其中提到产品配有内置扬声器、摄像头、健康传感器,并且带有AI功能,用户可以在没有显示屏的情况下与AI助手对话。  混合式AI加速落地,处理器、传感器保持迭代速度  生成式AI的进展不仅仅是在智能手表上。在可穿戴设备市场,最受关注的是厂商苹果和三星,这两家厂商分别在今年6月和7月宣布各自在生成式AI上的最新进展。       苹果推出了Apple Intelligence个人化智能系统,能理解个人情境,内置的大模型能深刻理解自然语言,能完成生成语言、图片,以及跨APP联动等功能,Apple Intelligence被整合进iPhone、iPad 和 Mac 芯片核心中,并且将其赋能给Siri。Siri是苹果在AI领域的重要布局,未来Apple Intelligence将结合Siri整合进苹果更多可穿戴设备产品中。       苹果以后来者的身份入局生成式AI的赛道,在接下来的时间里,苹果将持续训练Apple Intelligence ,并且推出更多基于生成式AI的功能,为硬件能带来全新的AI体验。       三星则是将AI功能深度整合进全新的可穿戴设备品类——智能戒指Galaxy Ring中。与苹果在生成式AI中以交互为重点不同,三星的生成式AI智能戒指更多聚焦在健康监测功能上,当然,这与产品的功能属性也有很大的关系。三星表示,Galaxy Ring可以通过AI对数据进行分析,提供个性化的健康和睡眠建议,并且还能够用手势控制三星智能手机。       三星还预告Galaxy AI新功能将更新到更多三星Galaxy 设备中,内置的AI算法,将为每位用户开发出个人知识图谱,并且打造更具个性化的服务。三星认为,多模态和情境AI将成为一个互联生态系统。       从苹果和三星在可穿戴生成式AI的布局也可以看到一个新的发展方向:混合式AI。例如苹果在AI领域选择OpenAI合作,三星选择联手谷歌。具体来看,苹果采用的是自研本地大模型+云端,部分AI功能在本地端采用Apple Intelligence,超出本地处理能力时基于OpenAI的GPT-4o模型,在云端实现更复杂的任务处理。       混合AI的策略不仅提升了设备的智能化水平,还通过引入先进的生成式AI技术,增强了用户体验。在苹果的带动下,未来可穿戴设备的“混合式AI”将加速落地。不过前提是,端侧AI足够强大。       不难发现,一方面生成式AI在更多可穿戴品类上落地,另一方面随着可穿戴设备的AI功能越来越丰富,所需要的主芯片、传感器等硬件的性能也需要更加强大支撑更多功能的实现,这也是多模态大模型能够得以落地的关键。       笔者认为,可穿戴设备AI的核心包括传感器、存储等。在主芯片方面,随着AI功能的增加,处理器的性能需要更加强大执行复杂的算法和任务,并且需要更高的集成度。在传感器方面,多模态的基础是来自传感器检测到的多种数据,Canalys表示每增加一个传感器,AI就能够多创建数十个基于该传感器的全新应用场景。当然,这要求传感器有更高的精确度。在存储方面,AI应用的增加对存储容量、速度带来要求。  小结  正如周鸿祎提到的“大模型是一种能力,找到核心的应用场景,跟能力结合是很重要的”,只有在具体的垂直场景里找到用户的痛点和刚需。生成式AI瞄准了快速增长的可穿戴设备市场,在智能手表、智能戒指、智能眼镜等设备上实现落地,并且为品牌厂商带来技术竞争优势,获得消费者的青睐。       在被业内人士认为是应用元年的2024年,生成式AI在可穿戴设备的渗透也只是刚刚开始。品牌厂商在寻找适合各自的技术路线,混合式AI成为其中一条技术路线被大家看到。功能体验的提升也推动着上下游产业链企业的产品迭代。
2024-08-02 11:12 阅读量:510
AI服务器与笔电升级带动高容值MLCC需求,供应商平均售价上涨
  根据TrendForce集邦咨询最新研究显示,今年上半年AI服务器订单需求稳健增长,下半年英伟达新一代Blackwell GB200服务器以及WoA AI赋能笔电,陆续于第三季进入量产出货阶段,将推升原始设计制造商(ODMs)备货动能逐月增温,预计带动高容值多层陶瓷电容器(MLCC)出货量攀升,进一步推升MLCC平均售价(ASP)。  高容值MLCC用量高达八成  TrendForce集邦咨询指出,由于AI服务器对质量要求高,加上目前各品牌厂Windows on Arm(WoA)笔电主要依赖高通(Qualcomm)公版设计,其中高容值MLCC用量高达八成。因此,掌握多数高容品项的日韩MLCC供应商将成为主要受益对象。  高容值产品订单需求增长过快,拉升MLCC总用量  另一方面,由于GB200高容标准品单位用量高,以GB200系统主板为例,MLCC总用量不仅较通用服务器增加一倍,1u以上用量占60%,X6S/X7S/X7R耐高温用量高达85%,系统主板MLCC总价也增加一倍,随着订单逐月增长,部分高容值产品订单需求增长过快,迫使日本厂商村田(Murata)拉长下单前置时间(Lead Time),从现有8周延长至12周。  每台WoA笔电MLCC总价大幅提高到5.5~6.5美金  此外,今年在Computex展会大放异彩的WoA笔电,尽管采用低能耗见长的精简指令集(‌RISC)‌架构(ARM)设计架构,整体MLCC用量仍高达1,160~1,200颗,与Intel高端商务机种用量接近。ARM架构下的MLCC容值规格也有所提高,其中1u以上MLCC用量占总用量近八成,导致每台WoA笔电MLCC总价大幅提高到5.5~6.5美金,材料成本上升,也拉高WoA笔电终端售价,平均价格均在一千美元以上。
2024-07-11 10:45 阅读量:661
2024年世界人工智能大会-除了Ai更有“爱”
  在上海2024年7月4日揭幕的2024年世界人工智能大会上,全球科技界的精英们不仅展示了最前沿的人工智能技术,更向世界宣告了AI的另一面 —— 它的温暖与“爱”。这场在上海举办的科技盛会,以“共商促共享 以善治促善智”为主题,不仅聚焦于AI技术的发展,更探讨了AI如何更好地服务于人类社会,提升我们的生活质量。  家庭陪伴机器人温馨亮相  在大会的展览区,家庭陪伴机器人吸引了众多参观者的目光。这款由耘趣携手晶视、声网、旷视以及凸凹设计共同开发的产品,不仅集成了顶尖的人工智能技术,更以其独特的设计理念,展现了AI的人文关怀。  家庭陪伴机器人的核心亮点:  ✦异地陪伴:机器人通过声网超低延时的音视频通讯技术,让身处异地的家人能够实时陪伴在亲人和宠物身边,传递跨越空间的关爱。  ✦超长续航:采用超低功耗场景优化技术,机器人一次充电可使用60天,减少了维护的繁琐,提供了更加自由的使用体验。  ✦智能识别:晶视的算例芯片配合旷视的先进图像算法赋予了机器人在不同场景下准确识别家人和宠物的能力,实现更加个性化的互动。  ✦产品造型:凸凹设计的精心打造,让家伴AI机器人不仅是家人更是一件艺术品,完美融入现代家居环境。  科技与人文的结合:AI技术的温情演绎  2024年世界人工智能大会不仅展示了AI技术的强大能力,更强调了科技与人文的结合。陪伴机器人的推出,正是这一理念的生动体现。它不仅是一个技术产品,更是一个情感的纽带,连接着家庭成员之间的爱与关怀。  科技视角:AI的未来发展方向  我们认为2024年世界人工智能大会的成功举办,为AI技术的发展指明了新的方向。未来,我们期待看到更多像陪伴这样的产品,它们不仅拥有强大的技术实力,更能够传递人类的情感与温暖。  结语  随着大会的深入进行,我们将继续关注AI技术的最新进展和应用。让我们共同期待,人工智能如何让世界变得更加智能,同时也更加充满“爱”。  如需了解更多AI及相关产品的方案和资讯,欢迎邮件至liconslee@ameya360.com或拨打+86 13861452902进行咨询。
2024-07-08 13:56 阅读量:451
  • 一周热料
  • 紧缺物料秒杀
型号 品牌 询价
BD71847AMWV-E2 ROHM Semiconductor
CDZVT2R20B ROHM Semiconductor
RB751G-40T2R ROHM Semiconductor
TL431ACLPR Texas Instruments
MC33074DR2G onsemi
型号 品牌 抢购
BU33JA2MNVX-CTL ROHM Semiconductor
TPS63050YFFR Texas Instruments
STM32F429IGT6 STMicroelectronics
ESR03EZPJ151 ROHM Semiconductor
IPZ40N04S5L4R8ATMA1 Infineon Technologies
BP3621 ROHM Semiconductor
热门标签
ROHM
Aavid
Averlogic
开发板
SUSUMU
NXP
PCB
传感器
半导体
相关百科
关于我们
AMEYA360微信服务号 AMEYA360微信服务号
AMEYA360商城(www.ameya360.com)上线于2011年,现 有超过3500家优质供应商,收录600万种产品型号数据,100 多万种元器件库存可供选购,产品覆盖MCU+存储器+电源芯 片+IGBT+MOS管+运放+射频蓝牙+传感器+电阻电容电感+ 连接器等多个领域,平台主营业务涵盖电子元器件现货销售、 BOM配单及提供产品配套资料等,为广大客户提供一站式购 销服务。