.

创业30年,英伟达的第四次高光时刻

白癜风一对一精细化治疗 https://disease.39.net/bjzkbdfyy/210620/9084749.html

作者

心缘

编辑

漠影

英伟达的激荡30年,有四大高光时刻。

第一次高光,是年世界上第一颗图形处理器(GPU)GeForce诞生,为终结显卡混战、奠定英伟达GPU霸主地位埋下伏笔。

第二次高光,是年革命性的统一编程软件CUDA发布,为多年后英伟达成为“AI计算之王”铺设了坚实的生态根基。

第三次高光,是年英伟达GPU助攻深度学习算法夺魁国际计算机视觉顶级赛事ImageNet竞赛,正式掀起人工智能(AI)第三次浪潮。

第四次高光,是年英伟达专为数据中心和高性能计算打造的TeslaVGPU,凭借凶残性能一统云端,从此笑傲数据中心计算江湖。

接连踩准游戏图显和人工智能两大风口,英伟达的营收和市值开始狂飙突进,其股价6年暴涨70倍,成为科技圈象征财富自由的“股市神话”。

年夏天,英伟达迎来历史时刻——数据中心业务季度营收首次超过游戏业务,成为英伟达第一大收入来源。年10月,英伟达市值超过台积电,首度登顶全球市值最高芯片公司,峰值一度超过亿美元量级。

不过,英伟达的爆发式成长,在今年短暂地按下暂停键。

随着疫情红利退潮,全球半导体产业开始面临需求衰减、库存待消的周期性困境,这在近期的财报季得到明显体现,多家芯片巨头发出预警。

英伟达也不例外。受宏观经济环境不景气、消费电子市场需求滑坡等因素的影响,英伟达近期预告的Q2财报业绩中,游戏业务同比、环比均骤降33%,致使其整体营收逊于预期。

但这份看似滞缓的财报预告,恰恰证明了英伟达创始人兼CEO黄仁勋的先见之明。

相比于陷入疲态的游戏业务,英伟达数据中心业务正发展迅猛,其最新季度营收已经接近游戏业务的两倍,同比增幅高达61%。

▲英伟达游戏及数据中心业务营收变化(芯东西制表)

这意味着,数据中心业务已取代游戏业务,成为撑起英伟达未来的一大主心骨。

财报波动只能反映短期的市场风向。无论是警告芯片行业将进入下行周期的分析师,还是刚披露最新季度财报的各路半导体巨头,无不认同数据中心、智能驾驶等新兴市场将长远地催生旺盛的芯片需求。

在这些新兴市场,英伟达拥有相当高的话语权,再加上借势元宇宙热潮,其产品在数据中心领域大受追捧。从人工智能、数据分析到数据科学,英伟达正通过持之以恒的技术创新,展示出颠覆数字世界的力量。

而这一切,都源自黄仁勋极具远见的前瞻性决策。对此,英伟达中国区工程和解决方案高级总监赖俊杰博士深有感触。

近日,在做客芯东西高端访谈栏目《芯焦点》对话中,赖俊杰与芯东西总编辑张国仁深入对话,深入阐释了英伟达如何在不同的时点,用技术塑造自身产业地位的背后逻辑,尤其在数据中心市场,让“加速计算专家”的形象越来越深入人心,并在营收上超过toC业务背后,是如何步步为营构筑全栈技术和生态优势的。

35:04

▲点击视频,观看赖俊杰做客本期《芯焦点》精彩访谈

一、纵向加速:全栈布局,英伟达的杀手锏

数据中心芯片战场硝烟弥漫,但英伟达始终屹立不倒。

在今年3月举行的英伟达GTC大会上,黄仁勋在演讲中谈到英伟达构建了四层技术栈:硬件、系统软件、软件平台、应用框架。

其中每一层,都紧密围绕着数据中心的刚需。芯片是算力基础,但要充分发挥其性能,必须构建完备的系统软件底层库。上层的三类平台及各种应用,更是为不同行业客户的诉求量身定制。

客户需要更高的AI算力需求,于是英伟达打造了更强的芯片、服务器和AI超级计算机;客户需要更好用的软件系统,来快速实现AI模型的训练和部署,于是英伟达构建了从底层系统软件、驱动软件、平台到上层的应用框架;客户需要在构建模拟真实场景的数字虚拟世界,于是英伟达打造了将计算机图形学与AI结合的NVIDIAOmniverse实时设计协作和模拟平台。

更有甚者,英伟达把主流AI算法模型做了个遍,并几乎通通开源。企业假如对某个AI算法缺乏积累,可以直接免费下载英伟达现成的先进模型,稍做调整就能落地应用。英伟达的NVIDIAAIEnterprise软件,足足将AI模型开发时间从80周缩至8周。

这样的全栈布局,已经成为英伟达在数据中心企业级市场的杀手锏。

你很难想出还有哪家企业,拥有如此完备成熟的硬件产品矩阵、如此广泛的AI计算开发者生态,又在软件模型研发方面积累雄厚。

追溯其根由,黄仁勋的棋局布得着实步步高明,令人拍手称妙。

当数据中心浪潮还未铺天盖地、人工智能训练还是小众领域,黄仁勋已经投入重金,研发通用计算GPU和统一编程软件CUDA,为英伟达谋一个远超游戏业务的更大生意——计算平台。

在那时,让GPU可编程,是个听起来不知道有什么用,又会让产品成本几乎翻倍的技术改变。没有客户愿意为此买单,但预判到单一功能图形处理器不是长远之计的黄仁勋,还是毅然决定,在英伟达所有产品线上都应用CUDA。

“Jensen(黄仁勋)作为创始人,在我们公司有非常权威的影响力,特别是人工智能这样一些事情上。”赖俊杰回顾说,为了这一愿景,早期黄仁勋快速调动了英伟达上上下下非常多的资源。

▲芯东西总编辑张国仁(左)与英伟达中国区工程和解决方案高级总监赖俊杰博士(右)对话

那绝对是难熬的五年,恰逢金融危机爆发、游戏业务增长停滞,英伟达的利润被近乎摧毁,股价也大幅下跌。

但最终结果,是黄仁勋赌赢了,正是他超前的决策、打造计算平台的愿景,让英伟达赢在了人工智能落地热潮的起点——年,深度学习算法的强悍计算表现轰动学术圈,作为高算力且易用的生产力工具,GPU+CUDA迅速风靡计算机科学界,成为人工智能开发的“标配”。

大量的芯片从业者这才恍然惊觉,急忙追随这位芯圈“预言家”的脚步,给自家芯片构建可编程计算的能力和软件栈。

16年前CUDA的问世,让从游戏开发者到超级计算开发者都可以编程使用英伟达的GPU产品;现在,英伟达继续沿着降低开发门槛的思路,通过持续迭代AI模型、软件及平台,让更多非专业AI开发者也能轻易投身于智能化升级的大潮中。

如今“全栈”已是所有瞄准云端数据中心市场的芯片公司的共识,即只有深入到应用中、理解应用的计算模式,才能给最终用户提供足够的价值。

不同的是,他们还在探索的路上,而更早起步的英伟达已经坐拥先发优势,其产品经过大量的资源投入和市场历练,不断积累各种不同的行业应用认知和迭代优化,并对英伟达的营收形成了正向的反馈。

过去五年,英伟达数据中心营收复合年均增长率为53%。截至今年5月,英伟达财年Q1财报显示,其数据中心业务销售收入达到创纪录的37.5亿美元,同比增长83%,已成英伟达收入占比最大、成长性最高的第一大业务。

当然,全栈的基础,是基于出色架构设计而打造的高性能芯片,如果抛开芯片本身,只强调全栈或者在软件方面的投入,那是空中楼阁。

二、横向扩展:算网通吃,三芯合体

彪悍的芯片性能,无需做过多解释。

两年前,NVIDIAATensorCoreGPU作为英伟达面向AI加速和高性能计算打造的“算力猛兽”横空出世,成为横扫云端数据中心基础设施的“顶流”硬件。

光是不断出现在各路AI计算论文及PPT展示的实测性能对比图,足见A一直被业界奉为AI训练加速硬件的标杆。但正如前文所述,英伟达想做的,显然不止是一颗芯片那么简单。

在今年国际权威AI基准测试平台MLPerf公布的最新结果中,A继续保持了高光战绩,是唯一参与全部8项基准测试的AI加速器,并在其中6项测试中计算速度第一。

实现这一成绩,靠得不仅仅是芯片理论峰值,而是系统级的比拼,即计算能力、内存带宽、互连结构、软件优化等综合作用的结果。

在硬件层面,A本身提供的高浮点计算能力、高内存带宽等性能,能让AI计算更快,但要想让整个系统都快,关键在于突破网络通信瓶颈。

对此,英伟达的布局也非常完整,既有GPU之间、GPU与CPU之间的NVLink互连技术,也有Infiniband、高速以太网等,能支持大规模集群中跨节点的高速数据传输。

在软件层面,英伟达在cuDNN等算子加速库、nccl等集体通信库方面做了很多工作,不给高性能的AGPU拖后腿。

“就像咱们经常在很多地方会举的木桶理论。”赖俊杰打了个比方,由多块木板构成的木桶,决定其盛水量的关键因素,不是最长的木板,而是最短的木板。类似的,数据中心要实现更好的整体实力,每个软硬件基础设施都不能有短板。

因此,数据中心设计者必须更宏观地考虑整个系统中的软硬件搭配,来更好地支持AI应用落地。

英伟达同样在补齐硬件短板。

年前,GPU还是英伟达芯片版图中的唯一主角。三年间,英伟达接连发布自研DPU和CPU,将GPU从“唯一”变成了“三分之一”。

今年英伟达还亮出了一个将自研CPU和GPU拼装到一起的互连“大招”NVLink-C2C,把数据传输速度相较连接传统CPU提升15倍。考虑到现在GPU显存大小受到工艺和成本的约束,这种将CPU和GPU粘在一起的做法,相当于间接扩展了GPU能访问到的高速存储,对于一些高性能计算或对GPU显存容量要求高的应用场景尤其适用。

至此,坐拥三大算力支柱的英伟达,已经成为数据中心企业级市场中的一位“全能型战士”。

英伟达也试图将GPU+CUDA的成功经验复制到DPU等更多硬件上,即通过编程语言定义硬件,包括推广针对DPU的DOCA、针对量子计算QPU的QODA软件开发架构等。

三、成为数据中心的加速计算专家

对于数据中心客户来说,英伟达的软硬件技术组合就像“堆积木”,可以按需选购,难点在于怎么选,才能匹配综合效用最大化的算力,以及实现更高的性价比。

赖俊杰说,在数据中心企业级市场,英伟达扮演的核心角色可以用一个词概之——加速计算专家。

“我们比较擅长去做性能的分析、优化。”他分享道,为扮演好这个的角色,英伟达除了提供丰富的产品矩阵,还在帮助数据中心企业级客户挖掘需求和提供技术搭配的建议。

在英伟达,赖俊杰主要负责带领团队对接中国区的核心大客户技术需求。他告诉芯东西,提供多层面的服务支持,是他们日常工作非常重要的一部分。

团队中,不同角色的同事分工合作,来跟客户坐在一起,帮客户梳理分析最重要的工作负载特征,寻找计算的热点,完成移植到GPU上的工作,并帮客户调整优化整个应用的链路性能。

当发现客户的一些典型应用、最


转载请注明:http://www.abachildren.com/xgyy/9780.html