英伟达：一个万亿级故事的启示-格隆汇

无论是初创企业还是巨头，都应从中汲取灵感，勇于创新，敢于挑战。

大.png

文/渔夫

编辑/程墨

来源/万点研究

在美国硅谷的创新风暴中，有一家公司的传奇故事足以让所有的创业梦想家热血沸腾——那就是英伟达。

1993年，美国加州圣何塞丹尼餐厅（Denny's）里，黄仁勋和他的两个朋友、克里斯·马拉考斯基（Chris Malachowsky）和柯蒂斯·普里姆（Curtis Priem）共同创立了英伟达。选择这家餐厅，老黄说“是因为这里比家里安静，而且有便宜的咖啡”。三个男人凑在一块，想用3D图像技术闯出一片天。这时候，市场上还没什么3D图形处理的标准，技术路线五花八门。

从一个小型创业公司到市值破3万亿美元的科技巨头，英伟达的历程就像一部硅谷版的《暴发户史》。它不仅在人工智能、自然语言处理和边缘计算等领域翻开了新篇章，更在科技历史上烙下了深深的印记、此时此刻也正在书写商业与科技传奇。

创业时期的黄仁勋

其实，在nvdia创立之初，30岁的黄仁勋也不清楚路该怎么走。用他自己的话：“坦率地说，我不知道该怎么做，他们也不知道。我们都不知道该怎么做。”

90年代英伟达NV1小试牛刀、NV2研发失败

90年代初期，电脑用户还在为2D图像和简单的动画而兴奋，对游戏性能的提升是玩家们的热切期盼。蓬勃发展的 PC 游戏市场，真正开始让人们开始关注 3D 图形在未来的重要性。然而，当时的显卡技术还无法满足日益复杂的游戏场景需求。英伟达的三位创始人黄仁勋、Chris Malachowsky和Curtis Priem，洞察到了这一市场空白，他们决定打造一款能够处理复杂3D图形处理产品，以满足游戏玩家的渴望。就这样，基于NV1的NVIDIA STG-2000X于1995年9月30日发布，是英伟达第一款真正意义上的显卡产品。NV1锁定的是图形处理需求的主要客户——游戏厂商，集图形处理、声卡及游戏手柄接口等功能于一体，算是当时市面上比较先进的产品。NV1不仅拥有先进的硬件规格，还引入了硬件加速的3D图形处理能力，使得游戏画面的流畅性和逼真度有了质的飞跃，理念超前。在那个时代，这是一个大胆的尝试，因为3D图形处理技术在PC领域尚处于起步阶段，许多人都质疑这样的创新是否能够被市场接受。

nVIDIA第一代芯片NV1

NV1的集成方案吸引到了正在和任天堂掰手腕的游戏主机厂商——日本世嘉，英伟达帮助世嘉完成3D游戏《VR战士》和《铁甲飞龙》的PC化移植。游戏机是不需考虑兼容问题的，于是英伟达作为仅有生产商，正好迎合了世嘉的需求，双方一拍即合，世嘉豪掷700万美元资助英伟达研发下一代NV2、用于让自家下一代主机——Dreamcas上。

这一年，微软收购RenderMorphics公司（旗下的Reality Lab实验室专事3D图形技术及API技术研究），并在后续发展出Windows 95的Direct 3D标准，并逐渐演化成PC游戏的事实标准。这对英伟达来说，可不是一个好消息。Direct 3D基于三角形纹理贴图，而英伟达的NV1却不能与之兼容，但微软的江湖统治力让英伟达深知Direct 3D将成为主流技术。换句话说，这将迫使英伟达不得不重新思考如何应对即将发生变天的PC市场。即使NV1在兼容性上遇到了一些挑战，但其带来的视觉震撼，让人们记住了来自英伟达的惊喜。

而这时候，英伟达犯错了：团队坚持使用方形绘图（主流技术为三角形绘图渲染），直接导致NV2研发失败、Dreamcast难产。黄仁勋坦言，英伟达当时的架构策略已经和主流3D图形技术趋势大相径庭，除了不能兼容Windows以外，实际游戏表现也很一般，如果要完成合约，必须从头研发一款图形处理器，而不履行合约，那700万美元的资金瞬间就会变成这家30人小公司的债务，此时的英伟达，距离破产只有一步之遥。

NV2的失败让英伟达陷入了严重的财务困境，公司的未来一度变得扑朔迷离。老黄选择飞往日本、面见世嘉。他坦诚因自己的错误，芯片已没有继续开发的必要，但还是希望对方能按合同付款。也许是老黄的真诚打动了世嘉，世嘉选择原谅和包容，继续付款，英伟达得以挺过难关。“正是我们正视了错误并及时止损，谦卑地寻求帮助，才挺过了倒闭危机。”黄仁勋回忆道。OpenGL API 和 Direct3D是当时3D图形开发领域的两大主流 API。后来，OpenGL计算机图形管道帮助英伟达杀出重围。用老黄对同事们的话说：“伙计们，我找到了我们的未来！”

企业参与市场竞争，从来不是一帆风顺。

1995年11月6日，人类历史上最伟大的显卡Voodoo横空出世，与英伟达也爆发出不小的火花。据说在鼎盛时期，Voodoo曾占领了85%的3D加速卡市场份额，是世界上市场占有率最高的3D芯片。Voodoo由科技创业公司3dfx推出，其在短短几年时间中迅速占领了市场，又很快从人们的视线中消失（2000年12月15日，Nvidia正式收购3DFX，成为图形芯片大战的最后胜出者）。

到了1996年，Direct3D被微软集成到了操作系统Windows 95 OSR2中，此时，引发3D显卡革命的《雷神之锤》问世了。这一年，市面上出现了第一批带3D功能的显卡，当时在国内见得比较多的包括S3公司的ViRGE显卡， ViRGE 一经推出，就被宣传为“世界上第一个集成 3D 图形加速器”，虽然它在 2D效果不错，但在 3D 方面却糟糕透顶。

竞品百花齐放，时代悄然来临。

1997年，凭借对技术的精准把控，英伟达趁势推出第三代产品Riva128，这是首颗支持微软Direct3D图形接口的高性能128位图形芯片，获得了微软的全力支持。靠着远超竞品4倍的性能得到市场青睐，四个月狂销100万片，英伟达涅槃重生！

而鲜有人知道，Riva128问世前，英伟达的全部资金仅能维持一个月工资支出。

而在制造具有高超复杂性的GPU RIVA 128的坎坷之路上，英伟达寻求了台积电的援助。张忠谋，这位台积电的奠基人，在阅读了黄仁勋亲笔书信后，亲自拨通了电话。接起电话的黄仁勋，与张忠谋共同达成了一个默契：英伟达可以全心专注于芯片的设计，生产事宜则安心交给台积电。随后，包括台积电、华硕和技嘉在内的业界翘楚，协助英伟达登上了全球显卡速度之巅。随着性能强大的TNT、TNT2陆续推出，竞争对手纷纷被挑落马下，英伟达终于在芯片市场站稳了脚跟。

英伟达发明了世界上第一个GPU

90年代前中期，市面上的显卡只有2D功能，而3D全靠CPU来进行运算。

1999年8月31日，英伟达推出GeForce 256显卡，在介绍之中，GeForce 256被称为“世界上第一个GPU”。包括戴尔、Gateway、康柏及NEC、IBM等都宣布将预装英伟达的GPU，而数个头部显卡生产商也纷纷倒戈，明确表示将加入英伟达阵营。

在此刻，英伟达只是想为玩家打造出最好的3D图形芯片，并未意识到已经拿到通向巅峰的钥匙。在游戏《雷神之锤》中，GPU的并行计算能力赋予了玩家在速度上的优势，使得英伟达GeForce显卡成为了游戏玩家的首选，GeForce 每每出新品都会有玩家跟上。GeForce 256如同一剂强心针，不仅使英伟达在游戏显卡市场一炮而红，也奠定了其在GPU图形加速领域的王者地位。GeForce 256不仅仅是对技术的升级，更是对市场策略的精准把握，它以亲民的价格、卓越的性能和对DirectX的无缝支持赢得了玩家的热烈欢迎。

1999年，英伟达在纳斯达克成功上市，IPO价格为每股12美元，股价迅速飚升，销售额达到1997年的440%，员工增加到270人，成为了报纸上轮番报道的硅谷新秀。

随着GeForce系列的不断迭代，英伟达的GPU开始变得越来越强大，每次新品的发布都如同一场游戏盛宴，让玩家们翘首以盼。从GeForce 3的先进纹理技术和可编程顶点着色器，到GeForce 4的多线程处理能力，英伟达的GPU逐渐成为游戏开发者心中的黄金标准。它们让游戏画面变得更加栩栩如生，特效更加逼真，游戏体验也随之提升到了全新的层次。

某种程度上，很多年来人们都几乎接受这样的事实：英伟达是被一家全球游戏玩家包养着的科技公司。游戏圈一直流行着这样一句话：选择N卡，是一种信仰。

nVIDIA新品 RTX显卡

在显示芯片顺风顺水的黄仁勋还提出一个“黄氏定律”，即“英伟达的核心战略就是产品将每6个月升级一次，功能翻一番。”这比1965年提出的摩尔定律（英特尔“摩尔定律”：芯片上可容纳的晶体管数目每隔18个月增加一倍，性能提升一倍）还要快3倍！

英伟达并没有止步于此，它继续深化与游戏开发者的合作，将GPU技术与游戏引擎紧密结合，共同推动游戏行业的发展。例如，英伟达的PhysX物理加速技术，让游戏中的物体运动更加真实，增加了游戏的沉浸感。此外，英伟达还推出了G-SYNC技术，解决了显示器刷新率与GPU输出帧率不匹配的问题，极大地减少了画面撕裂和卡顿，带来了更为流畅的游戏体验。

在这个过程中，英伟达的竞争对手们如ATI（后被AMD收购）也在努力追赶，但英伟达始终保持着技术领先和市场影响力的双重优势。它通过持续的创新，不断推出新的GPU架构，包括费米（Feimi）、开普勒（Kepler）、麦克斯韦（Maxwell）、帕斯卡（Pashcal）、伏特（Volt）、图灵（Turing）、安培（Ampere）和赫柏（Hopper）和布莱克韦尔（Blackwell）架构。经过15年的架构发展，正如英伟达官方所言：“人工智能计算领域的领导者，推动了AI、HPC、游戏、创意设计、自动驾驶汽车和机器人开发领域的进步。”每个架构都带来革命性的性能提升和新特性，巩固了其在游戏PC市场的主导地位。

而老黄并未停止。2024年6月2日，黄仁勋在台湾大学综合体育馆发表主题演讲，提出了新的架构路线图：2025年是Blackwell Ultra，2026年会有新架构Rubin，2027年则是Rubin Ultra。

老黄找到了“属于自己的世界”

科技成就，来自于始终如一的创新追求。GPU如此，CUDA亦如是。

GPU，这种神奇的工具，如同魔术师的手，构建出三维模型，赋予屏幕上的每一个像素生命力。这背后是无数简单指令的并行处理，图形芯片的性能随着微处理器数量的增长而提升。对如何最大化这些微处理器的并行计算潜力，英伟达始终抱有热切的探索之心。而这，也是CUDA诞生的原因。

CUDA从何而来？有何使命？

2000年，斯坦福大学生Ian Buck（现任英伟达副总裁）像每一个热衷于技术探索和DIY的男性，用 32 个英伟达 GeForce 显卡连在一起，外加 8 个投影仪来玩《雷神之锤》，自己造了个高清游戏机。这台超大尺寸游戏机不仅展示了科技的力量，更为GeForce显卡在游戏领域的成功打下了新的坚实基础。在探索的道路上，Buck成功地破解了显卡的原始编程工具“着色器（shader）”，利用其强大的并行计算能力，将GeForce显卡变成了一台低成本的超级计算机。

Ian Buck并非英伟达的员工，而是一名独立开发者，他对GPU的底层架构有着浓厚的兴趣，通过逆向工程成功地解密了英伟达的GPU指令集，创建了一个简单的编译器，允许程序员直接在GPU上编写代码，进行并行计算。其实，这一突破性的发现，为后来的CUDA编程模型和GPU计算的广泛应用奠定了基础。英伟达起初对此持保守态度，甚至有些担忧这一非官方的突破会对其产品产生负面影响。然而，随着并行计算在科学研究、工程计算和图形渲染等领域展现出的惊人性能，英伟达意识到这是一次巨大的机遇。

电影《头文字D》中，夏树对拓海说：“我记得曾经有人跟我说过，人最重要是找到属于自己的世界，只要找到属于自己的世界，人生才有意义。”

当发现GPU在超级计算领域的潜力时，我想那一刻，老黄应该找到了“属于自己的世界”。

老黄力邀Ian Buck加入，一同构建软件，使得每一块GeForce显卡都能展现出超级计算机的威力。同时，他敦促硬件团队对芯片架构进行革新，以适应更广泛的使用场景。时间推进到2006年岁末，黄仁勋向软件开发者敞开GPU的大门，发布了CUDA平台，赋予用户以英伟达强大计算能力、探索非图形领域，即允许用户将英伟达提供的算力应用于图形以外的目的。

CUDA的推出，标志着GPU不再仅仅是图形处理器，而是成为了通用计算平台。这一转变极大地推动了高性能计算、人工智能、机器学习等领域的发展。英伟达的这一决策，不仅巩固了其在GPU市场的领导地位，更引领了整个科技行业对于并行计算的广泛应用。例如，CUDA在物理学模拟、生物信息学分析、天气预报等领域都发挥了关键作用，甚至在电影特效制作中，GPU的并行处理能力也让视觉效果的渲染速度大幅提升。

英伟达的策略更为深远：不仅销售芯片，还要编织软件的基石。开放CUDA平台！这意味着，无论学生还是科学家，只需一台配备GPU的笔记本，就能挥洒创新。起初的几年，CUDA的投资回报并不均衡，黄仁勋的执着一度遭到股东们的质疑。然而，开发者们逐渐发现，GPU在处理现代人工智能系统的繁复计算时展现出非凡效率，特别是处理大量同步任务上，远超传统的CPU。这令黄仁勋倍感惊喜。在2016年接受《福布斯》深度访谈时，他承认曾预见到GPU在游戏之外的应用，但并未料到深度学习领域的大放异彩。商业直觉锐利的他，开始在公开场合频繁强调AI的重要性，积极倡导，成为人工智能的坚定倡导者。

nVIDIA数据中心解决方案

在AI研究和开发中，英伟达的CUDA生态系统显得尤为重要。这个平台提供了丰富的开发工具、库和框架，如TensorRT、cuDNN和NCCL，极大地简化了AI应用的开发过程，吸引了全球数万名开发者投身其中。通过CUDA，科研人员和工程师能够更高效地利用GPU进行深度学习模型的训练和优化，推动了AI领域的快速发展。在AI领域的领导地位并非一蹴而就，而是源于英伟达持续的投资和创新。例如，其A100和H100 GPU采用了先进的Hopper架构，专为大规模AI计算而设计，拥有更高的计算密度和更低的功耗。这些创新产品不仅提升了AI性能，还为数据中心的能效比带来了革命性的提升。

2009年，英伟达推出CUDA 2.0版本，正式将GPU推向了高性能计算领域，特别是AI计算。GPU的并行计算能力对于大量数据处理和模型训练至关重要，这使得英伟达的GPU成为了深度学习的首选硬件。比如，谷歌的AlphaGo在击败世界围棋冠军李世石的背后，就离不开英伟达GPU的强力支持。

英伟达的GPU在AI计算中的应用广泛，从数据中心到自动驾驶汽车，从医疗影像分析到虚拟现实，几乎涵盖了所有需要大规模计算的AI应用。例如，该公司推出的Tesla系列高性能计算卡，专为数据中心打造，为AI模型训练和推理提供了强大的计算能力。而针对自动驾驶领域，英伟达的Drive PX系列平台则为车辆提供了实时的感知、理解和决策能力。

马斯克：2024花费最多40亿美元购买英伟达芯片产品

时至今日，GPU几乎在AI模型训练中无可替代，成为开发者们的首选工具。从学术界、开源社区，到开发工具供应商，再到企业研发者，他们都将英伟达的GPU和CUDA编程语言作为构建AI应用的基石。每一个新兴的AI技术和工具，都以英伟达GPU的训练成果和CUDA编程后的执行表现作为衡量标准，推动着人工智能的不断迭代与革新。

而CUDA，已成为NVIDIA的技术“护城河”。

崛起，并非偶然，背后是英伟达对技术的极致探索、对未来的敏锐洞察、敢于突破的勇气，以及黄仁勋始终如一的不懈追求。正如采访中老黄发自初心的自述：没有魔法，只有过去61年来每一天的辛勤付出。

回顾历史，Ian Buck的破解行动，让全球的开发者开始重新审视GPU的角色，而英伟达随后的CUDA开放策略，更是将并行计算推向了巅峰。这一事件向我们证明，有时，一个小小的创新火花，就能点燃整个行业的变革之火。无论是初创企业还是巨头，都应从中汲取灵感，勇于创新，敢于挑战。

这是一次重要的启示！

爱穿皮衣的黄仁勋

英伟达：一个万亿级故事的启示

相关阅读

评论