搭载 Tensor Core 的 NVIDIA RTX GPU 正在加速生成式 AI 模型的开发与部署;即将推出的 Max-Q 低功耗 AI 推理将提高能效比。生成式 AI 正在迅速开创一个计算的新时代,为生产力、内容创作、游戏等多领域带来了变革。NVIDIA NeMo 和 DLSS 3 帧生成技术、Meta LLaMa、ChatGPT、Adobe Firefly、Stable Diffusion 等生成式 AI 模型和应用能够使用神经网络来识别现有数据中的模式和结构,以此生成新的原创内容。
专为 GeForce RTX 和 NVIDIA RTX GPU 优化的生成式 AI 模型具有高达 1,400 Tensor TFLOP 的 AI 推理性能,运行速度比同类其他设备快 5 倍。这要得益于 RTX GPU 中用于加速 AI 计算的专用硬件 Tensor Cores,以及常规的软件改进。上周在 Microsoft Build 大会上发布的增强功能等软件方面的改进使得像 Stable Diffusion 这样充分利用新的 DirectML 优化功能的生成式 AI 模型性能翻倍。
随着越来越多的 AI 推理在本地设备上运行,PC 将需要强大而高效的硬件以支持这些复杂的任务。为了满足这一需求,RTX GPU 将添加用于 AI 工作负载的 Max-Q 低功耗推理。在执行轻量级的推理任务时,GPU 将以极低的功耗运行,而在运行繁重负载如生成式 AI 工作时,则可升至极高的性能水平。
为了创建新的 AI 应用,在 Windows 11 上运行的整个 RTX 加速 AI 开发堆栈现已向开发者开放,使 AI 模型的开发、训练和部署变得更容易。开发者首先会通过Windows Subsystem for Linux(WSL)上经过优化的深度学习框架开发和微调模型。
然后开发者可以无缝上云并在各个主要云服务商(CSP)提供的相同 NVIDIA AI 堆栈上进行训练。接下来,开发者使用全新 Microsoft Olive 等工具优化训练好的模型以实现快速推理,最后面向专为 AI 优化的系统的 1 亿多 RTX PC 和工作站部署 AI 应用和功能。
微软 Windows 芯片和系统集成副总裁 Pavan Davuluri 表示:“未来几年,AI 将成为推动 Windows 客户创新的最大驱动力。我们正在与 NVIDIA 开展软硬件优化方面的合作,以此为开发者提供变革性的、高性能的、易于部署的体验。”
迄今为止,超过 400 款已发布的应用和游戏由 RTX AI 提供加速,该阵容还在持续壮大中。
在拉开了 Computex 2023 序幕的主题演讲中,NVIDIA 创始人兼首席执行官黄仁勋介绍了用于游戏开发的新生成式 AI——NVIDIA ACE 游戏开发版(NVIDIA Avatar Cloud Engine (ACE) for Games)。
通过 AI 驱动的自然语言互动,这项自定义 AI 模型代工服务使游戏中的非玩家角色(NPC)更加智能,从而彻底改变游戏体验。中间件、工具和游戏开发者可以使用 “ACE 游戏开发版(ACE for Games)” 在他们的软件和游戏中建立并部署定制化的语音、对话和动画 AI 模型。
在 RTX 上运行的生成式 AI 无处不在
从服务器到云,再到设备,在 RTX GPU 上运行的生成式 AI 无处不在。NVIDIA 的加速 AI 计算具有低时延、全栈式的特点。多年来,我们一直在优化 AI 软硬件架构的各个部分,包括 RTX GPU 上的专用 AI 硬件——第四代 Tensor Core。
通过对驱动的定期优化,能够确保峰值性能。最新 NVIDIA 驱动在与经 Olive 优化的模型和 DirectML 更新结合后,能够在 Windows 11 上大幅提升开发者的速度。例如在 Stable Diffusion 中,使用 DirectML 优化路径的开发者将干扰时间缩短了两倍。
借助基于 NVIDIA Ada Lovelace 架构打造的最新一代 RTX 笔记本电脑和移动工作站,用户可以在任何地方运行生成式 AI。新一代移动平台的外形尺寸只有 14 英寸,重量仅为 3 磅左右,将性能和便携性提升至新高。戴尔、惠普、联想、华硕等制造商正在 RTX GPU 和 Tensor Cores 的支持下,推动生成式 AI 时代的发展。
“随着各个行业继续部署 AI,预计到 2030 年,AI 需求的年增长率将超过 37%,企业和消费者将越来越需要合适的技术以实现 AI 的开发和落地,比如生成式 AI 等。多年来,联想一直致力于开发适用于 AI 工作负载的产品和解决方案,进而助力扩展生成式 AI 的应用范围——从设备到服务器、再到云。联想 ThinkPad、ThinkStation、ThinkBook、Yoga、Legion 和 LOQ 等搭载 NVIDIA RTX GPU 的 PC 正在推动生成式 AI 的变革浪潮,在节省时间、创作内容、完成工作和游戏等方面提供更好的用户体验。”
——联想副总裁兼 PC 业务和智能设备首席技术官 Daryl Cromer
“生成式 AI 是一项革命性的技术,同时也是促进各个行业未来创新的催化剂。惠普与 NVIDIA 共同为开发者提供卓越的性能、移动性以及运行当前加速 AI 模型所需的可靠性,推动全新生成式 AI 时代的发展。”
——惠普高级副总裁兼 Z 系列总经理 Jim Nottingham
“我们近期与 NVIDIA 围绕 Project Helix 的合作重点是助力企业更轻松地在本地构建和部署值得信赖的生成式 AI。在这个历史性时刻,我们进一步将生成式 AI 引入 PC 。想象一下,应用开发者能够在完善神经网络算法的同时,在本地控制训练数据和 IP。正是为了实现这个目标,我们设计了搭载 NVIDIA RTX GPU 的强大、可扩展 Precision 工作站。作为工作站领域的全球领导者,戴尔在帮助用户安全加速从边缘到数据中心的 AI 应用方面具有独特的优势。”
——戴尔科技客户产品部总裁 Ed Ward
“生成式 AI 的时代正在到来,因此需要强大的处理能力和经过全面优化的软硬件。借助 NVIDIA AI 平台,包括现在已经预装到我们许多产品上的 NVIDIA Omniverse,我们十分高兴能看到 AI 的变革在华硕和 ROG 笔记本电脑上持续不断地推动着。”
——华硕全球消费业务市场总监 Galip Fu
很快,搭载 RTX GPU 的笔记本电脑和移动工作站就将做到“两全其美”。纯 AI 推理工作负载将根据 Tensor Core 的性能进行优化,同时尽可能降低 GPU 的功耗,延长电池续航时间,并保持系统拥有出色的散热和降噪表现。GPU 还可根据工作负载的需要,动态提升至最高 AI 性能。
在线留言询价
型号 | 品牌 | 询价 |
---|---|---|
RB751G-40T2R | ROHM Semiconductor | |
CDZVT2R20B | ROHM Semiconductor | |
MC33074DR2G | onsemi | |
BD71847AMWV-E2 | ROHM Semiconductor | |
TL431ACLPR | Texas Instruments |
型号 | 品牌 | 抢购 |
---|---|---|
ESR03EZPJ151 | ROHM Semiconductor | |
STM32F429IGT6 | STMicroelectronics | |
BP3621 | ROHM Semiconductor | |
TPS63050YFFR | Texas Instruments | |
IPZ40N04S5L4R8ATMA1 | Infineon Technologies | |
BU33JA2MNVX-CTL | ROHM Semiconductor |
AMEYA360公众号二维码
识别二维码,即可关注