AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!
作者 | 物联网智库2023-03-22

3月20日至23日,英伟达GTC 2023如期举行。据了解,本届GTC大会将举办超过650场由技术、商业、学术等领域相关的会议,英伟达创始人兼CEO黄仁勋还在会前表示:这将是英伟达迄今为止最重要的一次GTC。

昨晚11点,本次GTC大会迎来了最重要的环节,黄仁勋带来了他在本次大会上的精彩演讲,分享了他对于人工智能未来的愿景,以及英伟达如何通过突破性技术和解决方案来加速计算光刻、生成式AI、云计算、工业生产等领域的下一波浪潮。

计算光刻速度提升40+倍

如今,芯片几乎成为各行各业得以发展的基础,芯片制造更是要求极高的精确度。举例来说,这种精确度的量级几乎相当于人类DNA链的尺寸,比细菌还要小1000倍以上。

而作为芯片制造过程的起始步骤,光刻就是在晶圆上创建图案的过程。在进行光刻时,光线由ASML的EUV极紫外光刻系统产生,激光脉冲每秒向一滴锡发射5万次,使其汽化,产生一种能发射13.5纳米EUV光的等离子体,随后再经过多层镜面来引导光线至光掩膜,光掩膜板中的多层反射器利用13.5纳米光的干涉图案实现更精细的特征。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

而在光刻机软硬件不变的情况下,采用数学模型和软件算法对照明模式、掩模图形与工艺参数等进行模拟和优化,可以有效提高光刻分辨率、增大工艺窗口,这类技术被称为“计算光刻”。更重要的是,随着算法的不断进步,当前计算光刻已经做到2nm的水平。黄仁勋表示,计算光刻模拟了光通过光学器件并与光刻胶相互作用时的行为,有着芯片设计和制造领域中最大的计算工作负载,很多大型数据中心更是全年无休的运行来创建用于光刻系统的掩膜板,每年消耗数百亿CPU小时。

为此,英伟达历时近四年,并与台积电、ASML等企业密切合作,正式推出了一个计算光刻库——cuLitho,将计算光刻加速了40倍以上。当前,英伟达的H100显卡上需要89块掩膜板,在CPU上运行时,用计算光刻处理单个掩膜板需要两周的时间,而如果在GPU上运行cuLitho,只需8小时即可处理完一个掩膜板。不仅如此,通过在500个DGX H100系统上使用cuLitho加速,台积电还用4000个Hopper GPU代替了用于计算光刻的4万台CPU服务器,在缩短时间的同时还可以提高产量,甚至功耗也从35MW降低至5MW,大大减少了制造过程中的碳足迹。

助力生成式AI重塑更多行业

在整个演讲的过程中,ChatGPT一词不知一共被老黄提到了几次,足以看出英伟达对此的重视程度。可以这么说,以ChatGPT为代表的生成式AI是一种新型计算机,一种可以用人类语言进行编程的计算机,这种改变将使每个人都可以命令计算机来解决问题。而在此之前,这是只有程序员才能接触的领域,现在每个人都可以是程序员,生成式AI也因此将会重塑几乎所有行业。

如果拆解背后的原理来看,ChatGPT依然使用了Transformer架构,而Transformer能以大规模并行的方式,从数据的关系和依赖性中学习上下文和含义,并因此涌现出了一些令人意想不到的能力。而这种大规模的并行计算,对计算能力提出了超高的要求。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

英伟达提供的DGX配有8个H100 GPU模组,相互协同工作后相当于一个巨型GPU,而每个H100都配有Transformer引擎,旨在快速处理类似ChatGPT这样的大模型。有意思的是,黄仁勋还表示,全球首款DGX就是由他亲手交给的OpenAI,甚至还在上面签了自己的名字。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

此外,相比于现在更加偏向通用领域的生成式AI,未来,一些专业领域的公司还需要使用其专有数据来构建和定制模型。今天,英伟达宣布推出一系列云服务,使企业能够构建、改进和运行自定义大型语言模型和生成式AI模型,使用自己的专有数据进行训练,并为各自领域的特定任务进行调整。黄仁勋表示:“NVIDIA AI Foundations让企业可以使用自己的数据定制基础模型,以生成人类最宝贵的资源——智慧和创造力。”其中,Nemo可用于构建定制的文本转文本模型,Picasso是一项视觉语言模型制作服务,面向希望使用授权内容或专有内容的用户,BioNemo则可以用来设计新分子,甚至构建ProGPT这样的蛋白质大模型。

图片

如今,随着各类生成式AI和大型语言模型的不断出现,初创公司都在竞相构建具有颠覆性的产品和商业模式,而现在的老牌公司则在寻求应对之法,避免落得个被颠覆的下场。为此,黄仁勋表示,英伟达宣布推出NVIDIA DGX Cloud,使得客户能够更简单快捷地访问NVIDIA AI,为迫切需要使用生成式AI的客户提供了在全球云端即时访问NVIDIA AI的机会。同时,英伟达通过与微软Azure、Google GCP和Oracle OCl合作,将英伟达的生态系统引入到了云服务提供商,使得英伟达触及的范围得以扩展,也与更多企业建立了双赢的合作伙伴关系。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

专为大模型推出的新品

虽然当晚的GTC活动中,没有推出采用英伟达的任何新GPU或GPU架构,但该公司却宣布推出全新的推理平台,包含四种配置L4、L40、H100NVL、GRACE-HOPPER,使用了一个体系架构和同一个软件栈。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

针对AI视频工作负载,英伟达推出了L4平台,针对视频解码和转码、视频内容审核以及视频通话功能,如:背景替换、重新打光、眼神交流等方面进行了优化,一台8-GPU L4服务器将取代一百多台用于处理AI视频的双插槽CPU服务器。

针对Omniverse、图形渲染以及文本转图像和文本转视频等生成式AI,英伟达宣布推出L40,其性能是英伟达最受欢迎的云推理GPU T4的10倍。

在高端市场中,英伟达推出专门针对大型语言模型的H100加速器变体——H100 NVL。据黄仁勋介绍,H100 NVL最重要的是其2个H100 PCIe板已经桥接在一起,组合的双GPU卡提供了188GB的HBM3 内存,即每张卡具有94GB内存,超过了迄今为止任何其他英伟达硬件提供的GPU内存。

Grace-Hopper是英伟达推出的新的超级芯片,通过提供900GB/秒的高速一致性芯片到芯片接口,非常适合处理大型数据集, 适用于推荐系统和大型语言模型的AI数据库。如今,利用大容量内存,CPU会存储和查询巨型嵌入表,然后将结果传输到 GPU进行推理,而借助于Grace-Hopper则可以查询嵌入表,并将结果直接传输到Hopper,速度比PCIE快7倍。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

Omniverse变革世界的方方面面

如今,半导体行业正在投资5000亿美元来建造84个新晶圆厂,到2030年时,汽车制造商还将建造300家工厂来生产2亿辆电动汽车,电池制造商也正在建造100多家特大型工厂。通过使用英伟达Omniverse平台,让各个行业先以虚拟的方式设计、构建、运营和优化实体产品和工厂,在真正的实体工厂建成之前,以数字方式进行整合,从而避免在最后时刻出现意外、变更订单和工厂延迟开工等情况,为全球工厂节省数十亿美元。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

众所周知,Omniverse是一个工业数字化平台旨在搭建数字化和物理实体之间的桥梁,其基于物理性质,反映物理定律,采用生成式AI来加速创建虚拟世界。黄仁勋表示,当前已有近30万名创作者和设计师下载了Omniverse,今年英伟达也在每个领域都对Omniverse进行了重大更新。

同样,英伟达也宣布推出NVIDIA Omniverse Cloud,这是一项完全托管的云服务,据黄仁勋介绍,Omniverse Cloud将被托管在Azure中,并正在将Omniverse Cloud连接到Microsoft 365生产力套件当中,其中包括Teams、OneDrive等,甚至还有Azure loT Digital Twins服务。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

最后,黄仁勋还表示,Omniverse不是一种工具,而是一个USD网络和共享数据库,可以连接、合成和模拟使用工具创建的3D资产,将一个平台的生态和所有其他平台的生态连接到一起,这或许才是真正的元宇宙雏形。

AI的iPhone时刻已经到来!英伟达投下核弹显卡,还能颠覆芯片光刻技术?让芯片计算光刻提速40倍!!

写在最后

从1993年创办英伟达时算起,黄仁勋已经担任CEO整整30年了,他也从30岁步入了60岁。在黄仁勋的带领下,如今的英伟达已经成长为全球市值第一高的图形计算公司。在今天的GTC大会上,可以看到英伟达的业务范围在进一步扩张,甚至进入到了量子计算和光刻机领域。展望未来,黄仁勋表示现在依然精力充沛,还想为英伟达再工作40年,或许40年后他会变成机器人,但他希望在足够长的时间内享受这一切。


热门文章
物联网数据作为现代社会产生的数据主力,加上未来物联网智能“社交”方面的场景,将为AIGC以及大模型提供用武之地。虽然目前还没有物联网与AIGC结合的应用出现,但未来不可避免。2022年11月,美国人工
2023-03-22
X