绿茶通用站群绿茶通用站群

火车站同站换乘30分钟够吗 同站换乘麻烦吗

火车站同站换乘30分钟够吗 同站换乘麻烦吗 “AI春晚”英伟达放大招:亮算力“杀器”、助游戏“捏人”;黄仁勋帮算账:GPU多买多省

  “AI热潮”最大赢家之一、英伟达背后的那个身穿黑(hēi)色皮衣的(de)男人(rén)又来了(le)。

  前脚才交出亮眼业(yè)绩狂拉股价,英伟达CEO黄(huáng)仁(rén)勋后脚就在昨日的COMPUTEX大会上(shàng)宣布,“我们已到达生(shēng)成式AI引(yǐn)爆(bào)点。从(cóng)此,全世界的每个角落,都会有计算需求。”

  如今英伟达掌握着全(quán)球(qiú)多(duō)家(jiā)科技公司“算力命脉”,而(ér)在(zài)这场大会上,黄仁勋激(jī)情(qíng)演讲2个小时(shí),甩(shuǎi)出了多项(xiàng)重磅新发布,包括算力“杀器”DGX GH200超级计算机(jī)、针对游戏的(de)ACE代工服(fú)务(wù)、MGX服务(wù)器(qì)规范等内容(róng)。

  算力“杀(shā)器”:DGX GH200超(chāo)级计算机(jī)+GH200超(chāo)级芯片

  先看(kàn)“集成(chéng)了英伟达最先进加速计算和网络技术”的DGX GH200人工智能超级计算机

  这(zhè)款超算专为大规模生成(chéng)式AI的负载所设计,由256块(kuài)GH200超级芯片组成,拥有1 exaflop超凡AI性(xìng)能、144TB内存(是英(yīng)伟达(dá)目前DGX A100系统的近500倍)、150英里光纤、2000多(duō)个风(fēng)扇。

  DGX GH200重(zhòng)达(dá)40000磅(约(yuē)合(hé)18143千克),堪比四只成(chéng)年大象(xiàng)的体重。

  预计DGX GH200将于今年年(nián)底投入问(wèn)世,英(yīng)伟达暂未公(gōng)布价格,而谷(gǔ)歌云、Meta与微软(ruǎn)将是首批(pī)用户

  同(tóng)时,英伟达也正在打造自家(jiā)基于DGX GH200的大型(xíng)AI超级计算机NVIDIA Helios,以(yǐ)支持(chí)其研(yán)究和开发团(tuán)队的工作。其中(zhōng)采(cǎi)用(yòng)4个DGX GH200系统、1024颗Grace Hopper超级芯(xīn)片,每(měi)个都(dōu)将(jiāng)与(yǔ)英(yīng)伟达Quantum-2 InfiniBand网络连接(jiē),带宽高达400Gb/s,将于今年年底上线。

  值得(dé)一(yī)提(tí)的(de)是,黄仁勋透露,DGX GH200集成的GH200 Grace Hopper超(chāo)级芯片已进入全面生产

  “拉踩”CPU:成本(běn)、功耗、处理数据量不如GPU

  在本次大会上,黄(huáng)仁勋还(hái)“拉踩(cǎi)”了一波CPU。他从功耗、处理数据量等方(fāng)面(miàn),指(zhǐ)出使用GPU胜(shèng)过(guò)CPU。

  举例来说,花费1000万(wàn)美元,可以建设一个有960颗CPU的数据中心,其可(kě)处理1X LMM(大语言模型(xíng))数据量,需要11GWh功耗;

  同(tóng)样成本下,也可以(yǐ)建设一个(gè)有48个GPU的数据(jù)中心,其(qí)可(kě)处理44X LLM数据量,仅(jǐn)需要3.2GWh功耗。

  若只(zhǐ)想处理1X LMM数(shù)据量(liàng),则只需(xū)40万美元,便可拥有一个搭载2个(gè)GPU、功耗(hào)仅0.13GWh的数据中心(xīn)。

  “买(mǎi)越多,省越多(The more you buy, the more you save)。”黄仁勋再次表示。

  同(tóng)时,他也列出了数据中心成本(běn)公式(shì):数(shù)据(jù)中心(xīn)总持(chí)有成本(běn)=f[成本(芯片、系统(tǒng)、硬件生(shēng)态系统)、吞(tūn)吐量(GPU、Algo软件(jiàn)、网络、系统软件(jiàn)、软件生态系统)、使用率(Algo Lib, 软件生(shēng)态系统)、采购运营、生命周期最佳化、电力]

  ACE代工服务:用AI激活NPC生命(mìng)

  游戏一直是备受关注的一大AI应用(yòng)落地(dì)领域。英(yīng)伟达也在(zài)大会上宣布(火车站同站换乘30分钟够吗 同站换乘麻烦吗bù),推出面(miàn)向游戏的定制AI模(mó)型代工服务NVIDIA Avatar Cloud Engine(ACE)

  它能赋予非玩家角色(sè)(NPC)更(gèng)智(zhì)能且不断进化的对话技能(néng),中间件、工具和游戏(xì)开发(fā)者可(kě)使用它来构建和部(bù)署定制的(de)语音(yīn)、对(duì)话和动画AI模型

  其(qí)中包括:英伟达NeMo,使用专有数(shù)据构建(jiàn)、定(dìng)制和部署语言(yán)模型;英伟达Riva,用于自动语音识别和文(wén)本转语(yǔ)音实(shí)现实时(shí)语音(yīn)对(duì)话(huà);英伟达Omniverse Audio2Face,用于即时创建游(yóu)戏角色表情动画,以匹(pǐ)配任何语音轨道。

  开(kāi)发人员可选择集成(chéng)整个NVIDIA ACE for Games解决方案,也可仅使用(yòng)需要的组(zǔ)件。

  新参考工作流程:帮助建设数字化智能工厂

  黄(huáng)仁勋表(biǎo)示(shì),全(quán)球(qiú)电子(zi)制造商(shāng)正在使用一(yī)种(zhǒng)全新的(de)综合参考工作流程推进工(gōng)业数字化工作,该工作流程结(jié)合了英伟达用(yòng)于生成式(shì)AI、3D协(xié)作(zuò)、仿真和自(zì)主(zhǔ)机器的(de)技术,包括:

  英伟达Omniverse,其连接了顶级(jí)计算机辅助设计应用(yòng)以(yǐ)及生成(chéng)式AI的API和(hé)前沿框(kuāng)架(jià);用于模拟和测试机器人(rén)的英伟达Isaac Sim应用(yòng)程序;英伟达Metropolis视觉AI框架,用于自动光学检(jiǎn)测。

  同时,黄仁(rén)勋(xūn)现场(chǎng)展示(shì)了一个完全(quán)数字化的智(zhì)能工厂的(de)演示。

  目前富士康工业互联(lián)网、宜鼎国际、和硕、广达和纬创正在(zài)使用(yòng)这一参考工(gōng)作(zuò)流程,具体用例(lì)包括电路板质保检测点自动化、光学检测(cè)自动化、建设(shè)虚拟(nǐ)工厂、模拟协(xié)作机器人、构建及运(yùn)营(yíng)数(shù)字孪生等。

  MGX服务器规范:快速高效构建(jiàn)百余(yú)种服(fú)务器配置

  英伟达发布NVIDIA MGX服务器(qì)规(guī)范,为系统制造(zào)商(shāng)提供(gōng)模块化参考架构,满足各(gè)种规(guī)模的数(shù)据中心(xīn)需求(qiú)。系统制造商可使用(yòng)它快速(sù)且经济(jì)高效地构建100多种服务器配置,以适(shì)应(yīng)广泛的AI、HPC及NVIDIA Omniverse应用。

  MGX支持英(yīng)伟(wěi)达(dá)全系列(liè)GPU、CPU、DPU和网(wǎng)络适(shì)配(pèi)器、各种x86、完(wán)整(zhěng)软件堆栈(zhàn)及Arm处理器,还可集成(chéng)到(dào)云和(hé)企业数据中(zhōng)心中。

  华(huá)硕(shuò)、和硕、QCT、超微(Supermicro)等都将采(cǎi)用MGX构(gòu)建下一(yī)代加速计算机,可将开(kāi)发(fā)成(chéng)本削(xuē)减多达3/4,并将开发时间缩短(duǎn)2/3至仅需6个(gè)月

  其中,QCT和(hé)超微基于MGX的设(shè)计将于(yú)8月面世(shì)。超微昨日公布的ARS-221GL-NR系统将(jiāng)采用Grace CPU,而(ér)QCT的(de)S74G-2U系(xì)统(tǒng)将采用Grace Hopper。

  推出Spectrum-X网络(luò)平(píng)台 构建超大规模生成式AI超级计算机Israel-1

  另外,黄仁勋宣(xuān)布推出NVIDIA Spectrum-X网络(luò)平台,旨(zhǐ)在提高(gāo)基于以太网的AI云的性能和效率(lǜ)。

  相(xiāng)比(bǐ)传统(tǒng)以太网结构,Spectrum-X可实现1.7倍的整体AI性能(néng)和能效提升,并具有高度通用(yòng)性,可(kě)用于各(gè)种(zhǒng)AI应用。它使用完全(火车站同站换乘30分钟够吗 同站换乘麻烦吗quán)基于标(biāo)准的以太网,并(bìng)可与基于(yú)以太网(wǎng)的堆栈互操作。该(gāi)平台支持(chí)256个200Gb/s端口(kǒu),通过单(dān)个交换(huàn)机连接,或(huò)在(zài)两层leaf-spine拓扑中提供16000个端(duān)口,以支持AI云增长和扩展,在(zài)保持性能的同时最大限度减少网络延迟。

  全(quán)球(qiú)领先(xiān)云计算提供商正在采用Spectrum-X平台(tái)扩展生成式AI服务,而Spectrum-X、Spectrum-4交换机、BlueField-3 DPU等已在戴尔、联想等系统制造商处提供。

  此外(wài),作为Spectrum-X参考设(shè)计的蓝图和测试平台(tái),英伟达正构建一台超大规(guī)模生成式AI超级计算机Israel-1。这台(tái)AI超算价值数亿(yì)美元(yuán),将采(cǎi)用戴尔PowerEdge XE9680服务器、英伟达HGX H100超级计算平(píng)台、内置(zhì)BlueField-3 DPU和Spectrum-4交换机(jī)的(de)Spectrum-X平(píng)台。

  结(jié)语

  “40年来,我们创造了PC、互联网、移(yí)动、云,现在是人工智能时代。你会创造(zào)什么?不管是什(shén)么,都要(yào)像我们一(yī)样追赶(gǎn)它(tā)。要(yào)奔跑,不要(yào)走。要(yào)么为了食(shí)物奔跑,要么作为食物奔跑。”

  在(zài)5月27日的(de)台湾大学发表了毕业典礼演(yǎn)讲上,黄(huáng)仁勋(xūn)再(zài)次强调了掌握AI技术(shù)的(de)重(zhòng)要(yào)性:很多(duō)人担心,AI会(huì)抢(qiǎng)走自(zì)己的(de)工作。但(dàn)真正(zhèng)会(huì)抢走(zǒu)你饭碗的,是掌(zhǎng)握(wò)了AI技术的人。

  他表示,从各方(fāng)面来看,AI的兴盛是计(jì)算机产业的再生(shēng)契机。在下个十年(nián),我们的(de)产(chǎn)业将(jiāng)使用新型AI电脑,取代价值万亿美元的传统(tǒng)电脑。

  而从昨日大会(huì)上黄仁勋的展示(shì)中,人工智能时代(dài)的未来(lái)轮廓(kuò)似(shì)乎已(yǐ)逐渐浮现。

未经允许不得转载:绿茶通用站群 火车站同站换乘30分钟够吗 同站换乘麻烦吗

评论

5+2=