英伟达:一个万亿级故事的启示

无论是初创企业还是巨头,都应从中汲取灵感,勇于创新,敢于挑战。

大.png

文/渔夫

编辑/程墨

来源/万点研究


在美国硅谷的创新风暴中,有一家公司的传奇故事足以让所有的创业梦想家热血沸腾——那就是英伟达。

1993年,美国加州圣何塞丹尼餐厅(Denny's)里,黄仁勋和他的两个朋友、克里斯·马拉考斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同创立了英伟达。选择这家餐厅,老黄说“是因为这里比家里安静,而且有便宜的咖啡”。三个男人凑在一块,想用3D图像技术闯出一片天。这时候,市场上还没什么3D图形处理的标准,技术路线五花八门。

从一个小型创业公司到市值破3万亿美元的科技巨头,英伟达的历程就像一部硅谷版的《暴发户史》。它不仅在人工智能、自然语言处理和边缘计算等领域翻开了新篇章,更在科技历史上烙下了深深的印记、此时此刻也正在书写商业与科技传奇。

1.png

创业时期的黄仁勋

其实,在nvdia创立之初,30岁的黄仁勋也不清楚路该怎么走。用他自己的话:“坦率地说,我不知道该怎么做,他们也不知道。我们都不知道该怎么做。”

90年代英伟达NV1小试牛刀、NV2研发失败

90年代初期,电脑用户还在为2D图像和简单的动画而兴奋,对游戏性能的提升是玩家们的热切期盼。蓬勃发展的 PC 游戏市场,真正开始让人们开始关注 3D 图形在未来的重要性。然而,当时的显卡技术还无法满足日益复杂的游戏场景需求。英伟达的三位创始人黄仁勋、Chris Malachowsky和Curtis Priem,洞察到了这一市场空白,他们决定打造一款能够处理复杂3D图形处理产品,以满足游戏玩家的渴望。就这样,基于NV1的NVIDIA STG-2000X于1995年9月30日发布,是英伟达第一款真正意义上的显卡产品。NV1锁定的是图形处理需求的主要客户——游戏厂商,集图形处理、声卡及游戏手柄接口等功能于一体,算是当时市面上比较先进的产品。NV1不仅拥有先进的硬件规格,还引入了硬件加速的3D图形处理能力,使得游戏画面的流畅性和逼真度有了质的飞跃,理念超前。在那个时代,这是一个大胆的尝试,因为3D图形处理技术在PC领域尚处于起步阶段,许多人都质疑这样的创新是否能够被市场接受。

2.png

nVIDIA第一代芯片NV1

NV1的集成方案吸引到了正在和任天堂掰手腕的游戏主机厂商——日本世嘉,英伟达帮助世嘉完成3D游戏《VR战士》和《铁甲飞龙》的PC化移植。游戏机是不需考虑兼容问题的,于是英伟达作为仅有生产商,正好迎合了世嘉的需求,双方一拍即合,世嘉豪掷700万美元资助英伟达研发下一代NV2、用于让自家下一代主机——Dreamcas上。

这一年,微软收购RenderMorphics公司(旗下的Reality Lab实验室专事3D图形技术及API技术研究),并在后续发展出Windows 95的Direct 3D标准,并逐渐演化成PC游戏的事实标准。这对英伟达来说,可不是一个好消息。Direct 3D基于三角形纹理贴图,而英伟达的NV1却不能与之兼容,但微软的江湖统治力让英伟达深知Direct 3D将成为主流技术。换句话说,这将迫使英伟达不得不重新思考如何应对即将发生变天的PC市场。即使NV1在兼容性上遇到了一些挑战,但其带来的视觉震撼,让人们记住了来自英伟达的惊喜。

而这时候,英伟达犯错了:团队坚持使用方形绘图(主流技术为三角形绘图渲染),直接导致NV2研发失败、Dreamcast难产。黄仁勋坦言,英伟达当时的架构策略已经和主流3D图形技术趋势大相径庭,除了不能兼容Windows以外,实际游戏表现也很一般,如果要完成合约,必须从头研发一款图形处理器,而不履行合约,那700万美元的资金瞬间就会变成这家30人小公司的债务,此时的英伟达,距离破产只有一步之遥。

NV2的失败让英伟达陷入了严重的财务困境,公司的未来一度变得扑朔迷离。老黄选择飞往日本、面见世嘉。他坦诚因自己的错误,芯片已没有继续开发的必要,但还是希望对方能按合同付款。也许是老黄的真诚打动了世嘉,世嘉选择原谅和包容,继续付款,英伟达得以挺过难关。“正是我们正视了错误并及时止损,谦卑地寻求帮助,才挺过了倒闭危机。”黄仁勋回忆道。OpenGL API 和 Direct3D是当时3D图形开发领域的两大主流 API。后来,OpenGL计算机图形管道帮助英伟达杀出重围。用老黄对同事们的话说:“伙计们,我找到了我们的未来!”

企业参与市场竞争,从来不是一帆风顺。

1995年11月6日,人类历史上最伟大的显卡Voodoo横空出世,与英伟达也爆发出不小的火花。据说在鼎盛时期,Voodoo曾占领了85%的3D加速卡市场份额,是世界上市场占有率最高的3D芯片。Voodoo由科技创业公司3dfx推出,其在短短几年时间中迅速占领了市场,又很快从人们的视线中消失(2000年12月15日,Nvidia正式收购3DFX,成为图形芯片大战的最后胜出者)。

到了1996年,Direct3D被微软集成到了操作系统Windows 95 OSR2中,此时,引发3D显卡革命的《雷神之锤》问世了。这一年,市面上出现了第一批带3D功能的显卡,当时在国内见得比较多的包括S3公司的ViRGE显卡, ViRGE 一经推出,就被宣传为“世界上第一个集成 3D 图形加速器”,虽然它在 2D效果不错,但在 3D 方面却糟糕透顶。

竞品百花齐放,时代悄然来临。

1997年,凭借对技术的精准把控,英伟达趁势推出第三代产品Riva128,这是首颗支持微软Direct3D图形接口的高性能128位图形芯片,获得了微软的全力支持。靠着远超竞品4倍的性能得到市场青睐,四个月狂销100万片,英伟达涅槃重生!

而鲜有人知道,Riva128问世前,英伟达的全部资金仅能维持一个月工资支出。

而在制造具有高超复杂性的GPU RIVA 128的坎坷之路上,英伟达寻求了台积电的援助。张忠谋,这位台积电的奠基人,在阅读了黄仁勋亲笔书信后,亲自拨通了电话。接起电话的黄仁勋,与张忠谋共同达成了一个默契:英伟达可以全心专注于芯片的设计,生产事宜则安心交给台积电。随后,包括台积电、华硕和技嘉在内的业界翘楚,协助英伟达登上了全球显卡速度之巅。随着性能强大的TNT、TNT2陆续推出,竞争对手纷纷被挑落马下,英伟达终于在芯片市场站稳了脚跟。

英伟达发明了世界上第一个GPU

90年代前中期,市面上的显卡只有2D功能,而3D全靠CPU来进行运算。

1999年8月31日,英伟达推出GeForce 256显卡,在介绍之中,GeForce 256被称为“世界上第一个GPU”。包括戴尔、Gateway、康柏及NEC、IBM等都宣布将预装英伟达的GPU,而数个头部显卡生产商也纷纷倒戈,明确表示将加入英伟达阵营。

在此刻,英伟达只是想为玩家打造出最好的3D图形芯片,并未意识到已经拿到通向巅峰的钥匙。在游戏《雷神之锤》中,GPU的并行计算能力赋予了玩家在速度上的优势,使得英伟达GeForce显卡成为了游戏玩家的首选,GeForce 每每出新品都会有玩家跟上。GeForce 256如同一剂强心针,不仅使英伟达在游戏显卡市场一炮而红,也奠定了其在GPU图形加速领域的王者地位。GeForce 256不仅仅是对技术的升级,更是对市场策略的精准把握,它以亲民的价格、卓越的性能和对DirectX的无缝支持赢得了玩家的热烈欢迎。

1999年,英伟达在纳斯达克成功上市,IPO价格为每股12美元,股价迅速飚升,销售额达到1997年的440%,员工增加到270人,成为了报纸上轮番报道的硅谷新秀。

随着GeForce系列的不断迭代,英伟达的GPU开始变得越来越强大,每次新品的发布都如同一场游戏盛宴,让玩家们翘首以盼。从GeForce 3的先进纹理技术和可编程顶点着色器,到GeForce 4的多线程处理能力,英伟达的GPU逐渐成为游戏开发者心中的黄金标准。它们让游戏画面变得更加栩栩如生,特效更加逼真,游戏体验也随之提升到了全新的层次。

某种程度上,很多年来人们都几乎接受这样的事实:英伟达是被一家全球游戏玩家包养着的科技公司。游戏圈一直流行着这样一句话:选择N卡,是一种信仰。

3.png

nVIDIA新品  RTX显卡

在显示芯片顺风顺水的黄仁勋还提出一个“黄氏定律”,即“英伟达的核心战略就是产品将每6个月升级一次,功能翻一番。”这比1965年提出的摩尔定律(英特尔“摩尔定律”:芯片上可容纳的晶体管数目每隔18个月增加一倍,性能提升一倍)还要快3倍!

英伟达并没有止步于此,它继续深化与游戏开发者的合作,将GPU技术与游戏引擎紧密结合,共同推动游戏行业的发展。例如,英伟达的PhysX物理加速技术,让游戏中的物体运动更加真实,增加了游戏的沉浸感。此外,英伟达还推出了G-SYNC技术,解决了显示器刷新率与GPU输出帧率不匹配的问题,极大地减少了画面撕裂和卡顿,带来了更为流畅的游戏体验。

在这个过程中,英伟达的竞争对手们如ATI(后被AMD收购)也在努力追赶,但英伟达始终保持着技术领先和市场影响力的双重优势。它通过持续的创新,不断推出新的GPU架构,包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡(Pashcal)、伏特(Volt)、图灵(Turing)、安培(Ampere)和赫柏(Hopper)和布莱克韦尔(Blackwell)架构。经过15年的架构发展,正如英伟达官方所言:“人工智能计算领域的领导者,推动了AI、HPC、游戏、创意设计、自动驾驶汽车和机器人开发领域的进步。”每个架构都带来革命性的性能提升和新特性,巩固了其在游戏PC市场的主导地位。

而老黄并未停止。2024年6月2日,黄仁勋在台湾大学综合体育馆发表主题演讲,提出了新的架构路线图:2025年是Blackwell Ultra,2026年会有新架构Rubin,2027年则是Rubin Ultra。

老黄找到了“属于自己的世界”

科技成就,来自于始终如一的创新追求。GPU如此,CUDA亦如是。

GPU,这种神奇的工具,如同魔术师的手,构建出三维模型,赋予屏幕上的每一个像素生命力。这背后是无数简单指令的并行处理,图形芯片的性能随着微处理器数量的增长而提升。对如何最大化这些微处理器的并行计算潜力,英伟达始终抱有热切的探索之心。而这,也是CUDA诞生的原因。

CUDA从何而来?有何使命?

2000年,斯坦福大学生Ian Buck(现任英伟达副总裁)像每一个热衷于技术探索和DIY的男性,用 32 个英伟达 GeForce 显卡连在一起,外加 8 个投影仪来玩《雷神之锤》,自己造了个高清游戏机。这台超大尺寸游戏机不仅展示了科技的力量,更为GeForce显卡在游戏领域的成功打下了新的坚实基础。在探索的道路上,Buck成功地破解了显卡的原始编程工具“着色器(shader)”,利用其强大的并行计算能力,将GeForce显卡变成了一台低成本的超级计算机。

Ian Buck并非英伟达的员工,而是一名独立开发者,他对GPU的底层架构有着浓厚的兴趣,通过逆向工程成功地解密了英伟达的GPU指令集,创建了一个简单的编译器,允许程序员直接在GPU上编写代码,进行并行计算。其实,这一突破性的发现,为后来的CUDA编程模型和GPU计算的广泛应用奠定了基础。英伟达起初对此持保守态度,甚至有些担忧这一非官方的突破会对其产品产生负面影响。然而,随着并行计算在科学研究、工程计算和图形渲染等领域展现出的惊人性能,英伟达意识到这是一次巨大的机遇。

电影《头文字D》中,夏树对拓海说:“我记得曾经有人跟我说过,人最重要是找到属于自己的世界,只要找到属于自己的世界,人生才有意义。”

当发现GPU在超级计算领域的潜力时,我想那一刻,老黄应该找到了“属于自己的世界”。

老黄力邀Ian Buck加入,一同构建软件,使得每一块GeForce显卡都能展现出超级计算机的威力。同时,他敦促硬件团队对芯片架构进行革新,以适应更广泛的使用场景。时间推进到2006年岁末,黄仁勋向软件开发者敞开GPU的大门,发布了CUDA平台,赋予用户以英伟达强大计算能力、探索非图形领域,即允许用户将英伟达提供的算力应用于图形以外的目的。

CUDA的推出,标志着GPU不再仅仅是图形处理器,而是成为了通用计算平台。这一转变极大地推动了高性能计算、人工智能、机器学习等领域的发展。英伟达的这一决策,不仅巩固了其在GPU市场的领导地位,更引领了整个科技行业对于并行计算的广泛应用。例如,CUDA在物理学模拟、生物信息学分析、天气预报等领域都发挥了关键作用,甚至在电影特效制作中,GPU的并行处理能力也让视觉效果的渲染速度大幅提升。

英伟达的策略更为深远:不仅销售芯片,还要编织软件的基石。开放CUDA平台!这意味着,无论学生还是科学家,只需一台配备GPU的笔记本,就能挥洒创新。起初的几年,CUDA的投资回报并不均衡,黄仁勋的执着一度遭到股东们的质疑。然而,开发者们逐渐发现,GPU在处理现代人工智能系统的繁复计算时展现出非凡效率,特别是处理大量同步任务上,远超传统的CPU。这令黄仁勋倍感惊喜。在2016年接受《福布斯》深度访谈时,他承认曾预见到GPU在游戏之外的应用,但并未料到深度学习领域的大放异彩。商业直觉锐利的他,开始在公开场合频繁强调AI的重要性,积极倡导,成为人工智能的坚定倡导者。

4.png

nVIDIA数据中心解决方案

在AI研究和开发中,英伟达的CUDA生态系统显得尤为重要。这个平台提供了丰富的开发工具、库和框架,如TensorRT、cuDNN和NCCL,极大地简化了AI应用的开发过程,吸引了全球数万名开发者投身其中。通过CUDA,科研人员和工程师能够更高效地利用GPU进行深度学习模型的训练和优化,推动了AI领域的快速发展。在AI领域的领导地位并非一蹴而就,而是源于英伟达持续的投资和创新。例如,其A100和H100 GPU采用了先进的Hopper架构,专为大规模AI计算而设计,拥有更高的计算密度和更低的功耗。这些创新产品不仅提升了AI性能,还为数据中心的能效比带来了革命性的提升。

2009年,英伟达推出CUDA 2.0版本,正式将GPU推向了高性能计算领域,特别是AI计算。GPU的并行计算能力对于大量数据处理和模型训练至关重要,这使得英伟达的GPU成为了深度学习的首选硬件。比如,谷歌的AlphaGo在击败世界围棋冠军李世石的背后,就离不开英伟达GPU的强力支持。

英伟达的GPU在AI计算中的应用广泛,从数据中心到自动驾驶汽车,从医疗影像分析到虚拟现实,几乎涵盖了所有需要大规模计算的AI应用。例如,该公司推出的Tesla系列高性能计算卡,专为数据中心打造,为AI模型训练和推理提供了强大的计算能力。而针对自动驾驶领域,英伟达的Drive PX系列平台则为车辆提供了实时的感知、理解和决策能力。

5.png

马斯克:2024花费最多40亿美元购买英伟达芯片产品

时至今日,GPU几乎在AI模型训练中无可替代,成为开发者们的首选工具。从学术界、开源社区,到开发工具供应商,再到企业研发者,他们都将英伟达的GPU和CUDA编程语言作为构建AI应用的基石。每一个新兴的AI技术和工具,都以英伟达GPU的训练成果和CUDA编程后的执行表现作为衡量标准,推动着人工智能的不断迭代与革新。

而CUDA,已成为NVIDIA的技术“护城河”。

崛起,并非偶然,背后是英伟达对技术的极致探索、对未来的敏锐洞察、敢于突破的勇气,以及黄仁勋始终如一的不懈追求。正如采访中老黄发自初心的自述:没有魔法,只有过去61年来每一天的辛勤付出。

回顾历史,Ian Buck的破解行动,让全球的开发者开始重新审视GPU的角色,而英伟达随后的CUDA开放策略,更是将并行计算推向了巅峰。这一事件向我们证明,有时,一个小小的创新火花,就能点燃整个行业的变革之火。无论是初创企业还是巨头,都应从中汲取灵感,勇于创新,敢于挑战。

这是一次重要的启示!

6.png

爱穿皮衣的黄仁勋

格隆汇声明:文中观点均来自原作者,不代表格隆汇观点及立场。特别提醒,投资决策需建立在独立思考之上,本文内容仅供参考,不作为实际操作建议,交易风险自担。

相关阅读

评论