广告

一文详解GPU简史:从电脑游戏到算力战场

2025-07-14 歪睿老哥 阅读:
二十一世纪的战争,早已不是钢铁洪流的对撞,真正的生死搏杀,发生在无形的算力之巅。

二十一世纪的战争,早已不是钢铁洪流的对撞,真正的生死搏杀,发生在无形的算力之巅。JLQednc

谁掌握了算力,谁就扼住了时代的咽喉。JLQednc

而GPU,这块小小的、曾被视为游戏少年快乐源泉的硅片,如今,已然成为悬于全球权力王座之上的达摩克利斯之剑。JLQednc

这柄剑,曾让无数玩家在虚拟世界里热血沸腾,如今,却让大国在现实世界里剑拔弩张。JLQednc

当美国挥舞着制裁大棒,试图用一纸禁令锁死一个国家科技发展的咽喉时,全球化那层温情脉脉的面纱被彻底撕下,露出底下赤裸裸的战略绞杀 1JLQednc

这不再是简单的商业竞争,这是一场科技领域的“锁喉战” JLQednc

显卡的演变史,从此刻起,便不再是一部单纯的技术进步史,而是一部从游戏厅娱乐到国运战场的残酷战争史。JLQednc

要理解这场战争的本质,我们必须回到原点,回到那个群雄并起、草莽混战的年代,去看一看王者的陨落、赌徒的逆袭,以及帝国的崛起。JLQednc

第一章:蛮荒时代与旧王陨落

 

历史的车轮滚滚向前,总有王者登基,也总有旧王悲歌。JLQednc

在个人电脑的蛮荒时代,3D图形是少数人的奢侈品。JLQednc

那时,想要体验逼真的三维世界,你需要的是一台来自“硅谷图形”(SGI)公司的专业工作站。JLQednc

这些机器性能强大,但价格也同样惊人,动辄数万甚至数十万美元,JLQednc

只有好莱坞的电影特效团队或者军方的实验室才能负担得起。像《侏罗纪公园》里栩栩如生的恐龙,就是诞生在这样的“神坛”之上。JLQednc

平民玩家想要一窥3D世界的门径,只能依赖CPU进行“软件渲染”,其结果是卡顿的画面和粗糙的贴图,体验聊胜于无 。JLQednc

直到一家名为3dfx的公司横空出世,神坛才开始崩塌。JLQednc

1996年,3dfx带着它的Voodoo(巫毒)显卡杀入市场,如同平地惊雷。JLQednc

这并非一张完整的显卡,而是一块纯粹的3D加速卡,需要通过一根“转接线”连接在你的主显卡上,专门负责3D运算   。JLQednc

这种看似“寄生”的设计,却带来了革命性的性能。一夜之间,PC游戏的面貌被彻底改写。JLQednc

凭借Voodoo的恐怖实力,3dfx迅速统一了蛮荒的3D江湖。JLQednc

1997年,它占据了高达85%的市场份额,成为无可争议的绝对王者。JLQednc

它自创的Glide API,也成了那个时代游戏开发者的“圣经”。JLQednc

当时的游戏,如果你想获得最好的画面和最流畅的体验,唯一的选择就是Glide模式。JLQednc

3dfx的logo,就是顶级游戏体验的保证。JLQednc

然而,王者的宝座,往往建立在致命的骄傲之上。JLQednc

3dfx沉醉在自己的Glide王国里,对外界的变化充耳不闻。JLQednc

它坚信,凭借自己无敌的硬件性能和封闭的API生态,就能号令天下。JLQednc

但它忽略了一个正在悄然崛起的庞然大物——微软。JLQednc

微软看到了PC游戏市场的巨大潜力,决心将图形接口的话语权掌握在自己手中。JLQednc

它推出了DirectX,一个旨在统一硬件标准的API 。JLQednc

这是一个阳谋,微软要建立的是一个平台帝国,让所有的硬件厂商都在它的规则下游戏。JLQednc

面对微软递来的橄榄枝,骄傲的3dfx不屑一顾。JLQednc

它拒绝拥抱DirectX,固守自己的Glide壁垒,试图与整个Windows生态对抗  。JLQednc

这是一个致命的战略误判。历史无数次证明,与平台和标准对抗,无异于螳臂当车。JLQednc

当3dfx还在享受王者的荣光时,它的竞争对手们,如Nvidia(英伟达)、ATI等,纷纷投入了微软的怀抱。JLQednc

随着DirectX版本的快速迭代,其性能和功能不断完善,慢慢追上了Glide。而坚守Glide的游戏开发者越来越少,3dfx逐渐成了孤家寡人   。JLQednc

更致命的是,3dfx在产品战略上也昏招频出。JLQednc

它长期坚持3D/2D分离的设计,错过了整合显卡的浪潮;JLQednc

它为了控制渠道,悍然收购了自己的板卡合作伙伴STB,结果激怒了其他所有合作伙伴,他们纷纷转投Nvidia阵营,让3dfx自断臂膀 。JLQednc

当3dfx终于幡然醒悟,试图通过开源Glide、推出整合显卡来挽回败局时,一切都为时已晚   。JLQednc

2000年底,这家曾经的王者,在内忧外患和一系列官司的拖累下,轰然倒塌,最终被它的宿敌Nvidia收购了技术和员工,一代王朝就此落幕 。JLQednc

3dfx的陨落是一个深刻的教训:JLQednc

在科技的战场上,一时的技术领先并不代表永恒的胜利,战略上的短视和对生态的漠视,足以让任何巨人瞬间崩塌。JLQednc

第二章:赌徒黄仁勋与英伟达的崛起

旧王倒下,新王当立。JLQednc

而这位新王,从骨子里就是一个彻头彻尾的赌徒。JLQednc

他的名字叫黄仁勋(Jensen Huang),一个穿着标志性皮衣、从台湾移民到美国的男人 。JLQednc

他的故事,就是一部将“赌命”奉为圭臬的传奇。JLQednc

1993年,黄仁勋与两位好友在丹尼餐厅的一张餐桌上,创立了英伟达   。JLQednc

他们的初心很简单:为PC游戏提供强大的图形处理能力 。JLQednc

但这条路远比想象的艰难。JLQednc

英伟达的第一个产品叫NV1,这是一个野心勃勃的“多媒体卡”,集成了2D/3D图形、声卡甚至游戏手柄接口。JLQednc

它还采用了一种名为“二次曲面”的独特3D渲染技术,并拉拢了游戏巨头世嘉(Sega)为其站台,希望将世嘉土星游戏移植到PC上。JLQednc

然而,这场豪赌惨败。JLQednc

NV1的技术路线与主流的“三角形渲染”背道而驰,当微软的DirectX确立了三角形为行业标准后,NV1瞬间成了技术孤岛。JLQednc

它高昂的价格和糟糕的兼容性让市场恶评如潮,与世嘉的合作也因技术分歧而破裂,甚至差点让世嘉取消了后续的合作款项,这笔钱在当时是英伟达的救命钱。JLQednc

NV1的失败,几乎将初生的英伟达推向了破产的悬崖。JLQednc

到1996年,黄仁勋不得不裁掉公司一半以上的员工,公司上下弥漫着绝望的气息。JLQednc

正是在这生死存亡的关头,黄仁勋的赌徒本性被彻底激发。JLQednc

他意识到,必须放弃幻想,彻底拥抱微软的DirectX标准,并用一款无可匹敌的产品来逆天改命。JLQednc

这个产品,就是RIVA 128。JLQednc

1997年,英伟达账上的现金只够再烧六个月 。JLQednc

黄仁勋押上了公司的全部身家,决定跳过所有物理原型测试环节,仅凭软件模拟的结果,就直接将RIVA 128芯片投入量产   。JLQednc

这是一场史无前例的豪赌。他对员工说:“我告诉领导们,我知道它会是完美的。因为如果它不完美,我们就会破产。所以,让我们把它做成完美的。” JLQednc

这句“要么完美,要么破产”的宣言,从此烙印在了英伟达的企业基因里。JLQednc

幸运的是,赌徒赢了。JLQednc

RIVA 128虽然也存在缺陷(比如32种DirectX混合模式只支持了8种),但凭借其强大的综合性能和对DirectX的良好支持,一经推出便大获成功,四个月内销量突破一百万片,将英伟达从死亡线上拉了回来。JLQednc

更重要的是,在与世嘉的合作中,黄仁勋展现了惊人的商业智慧。JLQednc

他坦诚地向世嘉CEO表示,如果继续履行原合同,英伟达会死,而世嘉也会得到一个错误架构的产品。JLQednc

他请求世嘉终止合同,但全额支付合同款。出人意料的是,世嘉CEO同意了。这笔500万美元的“救命钱”,让英伟达得以度过最艰难的时期,专注于RIVA 128的研发   JLQednc

这场赌命式的胜利,不仅拯救了英伟达,更淬炼出了这家公司日后赖以生存的狼性文化:JLQednc

对技术方向的敏锐判断、对市场机会的极限押注,以及在绝境中求生的强大意志力   JLQednc

黄仁勋和他领导的英伟达,从此踏上了通往王座的血腥征途。JLQednc

第三章:双雄争霸:架构与工艺的哲学之战

3dfx倒下后,显卡市场并未迎来和平,反而进入了长达十年的双雄争霸时代。JLQednc

舞台的主角,是英伟达和另一家加拿大公司ATI。JLQednc

这场争霸,本质上是两种发展哲学的对决   JLQednc

ATI(后来被AMD收购)的哲学是“工艺为王”。JLQednc

它更务实,精于制造,总是积极拥抱最新的芯片制造工艺   JLQednc

它相信,更先进的制程能带来更低的功耗和更高的性能,愿意为此承担先行者的风险。JLQednc

它的策略,可以称之为“小步快跑”,通过不断迭代工艺来保持竞争力   JLQednc

而英伟达,在黄仁勋的带领下,则信奉“架构为王” JLQednc

它更激进,迷信通过卓越的芯片设计来获得压倒性优势。JLQednc

在制程工艺上,英伟达反而显得保守,它宁愿让ATI先去趟雷,等新工艺成熟稳定后自己再跟进,从而将更多的工程资源投入到架构研发上   JLQednc

它的策略,是“大步慢走”,每一次架构更新都是一次巨大的飞跃。JLQednc

这种哲学差异,在两家公司面对新工艺节点的风险选择上体现得淋漓尽致。JLQednc

ATI倾向于先用新工艺制造小尺寸、低风险的芯片(“little jump”),确保良率和稳定;JLQednc

而英伟达则倾向于直接用新工艺制造大尺寸、高性能的旗舰芯片(“big jump”),哪怕初期良率很低,也要通过这种方式来探索新工艺的极限,为后续产品积累经验,并一举在性能上超越对手。JLQednc

这场哲学之战的经典对决,发生在2001年的GeForce 3与Radeon 8500之间   JLQednc

当时的ATI Radeon 8500,在功能和价格上都极具优势,支持双屏显示,价格几乎只有对手的一半,性价比极高   JLQednc

而英伟达的GeForce 3 Ti500,则凭借更强的架构,在纯粹的运行速度上保持着微弱的领先   JLQednc

但GeForce 3真正的杀手锏,并非这微弱的速度优势,而是它率先引入的“可编程着色器”(Programmable Shader) JLQednc

这是一个革命性的创新。JLQednc

在此之前,GPU的渲染管线是固定的,开发者只能调用芯片预设好的功能。JLQednc

而可编程着色器的出现,意味着开发者第一次可以直接编写程序,来控制GPU的渲染过程,实现前所未有的光影和特效。JLQednc

这颗小小的“可编程”种子,在当时并未引起所有人的注意。JLQednc

但黄仁勋和他的英伟达,已经看到了一个全新的未来。JLQednc

他们意识到,GPU的未来绝不仅仅是画三角形,而是成为一个通用的、可编程的并行计算引擎。JLQednc

这个深邃的远见,为英伟达日后建立一个让世界都难以逾越的软件帝国,埋下了最关键的伏笔。JLQednc

第四章:CUDA长城:一统江湖的阳谋

 

真正的霸业,从来不是靠一城一地的得失,而是建立一套规则,让所有人都生活在你的体系里,离不开你。JLQednc

英伟达的这套规则,就是CUDA。JLQednc

在CUDA出现之前,用GPU进行通用计算(GPGPU)是一件极其痛苦的事情 JLQednc

开发者需要将计算问题伪装成图形渲染任务,使用复杂的图形API(如OpenGL或Direct3D)来间接调用GPU的算力,这不仅效率低下,而且门槛极高,只有少数顶尖专家才能掌握   JLQednc

2006年,英伟达推出了CUDA(Compute Unified Device Architecture,统一计算设备架构),一切都改变了 。JLQednc

CUDA的诞生,源于一个名叫伊恩·巴克(Ian Buck)的斯坦福博士生。JLQednc

他在2004年加入了英伟达,他的目标是创造一个能让任何C语言程序员都能轻松上手GPU编程的平台 。JLQednc

黄仁勋敏锐地捕捉到了这个想法的巨大潜力,力排众议,投入巨资支持CUDA的研发。JLQednc

他要的不仅仅是卖显卡,他要的是将英伟达的GPU,打造成科学计算领域的通用硬件平台 。JLQednc

这是一个宏大无比的“阳谋”。英伟达不再仅仅是一家硬件公司,它开始构建一个庞大的软件帝国   JLQednc

CUDA的革命性在于,它极大地降低了GPU编程的门槛JLQednc

开发者不再需要学习复杂的图形学知识,只需使用熟悉的C/C++、Fortran或Python等语言,加上一些简单的扩展,就能释放GPU强大的并行计算能力   JLQednc

这一举措,如同打开了潘多拉的魔盒。全世界的科研人员、工程师和开发者蜂拥而至,将CUDA应用于各种曾经无法想象的领域:JLQednc

从分子动力学模拟、气象预报,到密码破解、金融建模,再到医学成像和生物信息学   JLQednc

无数的应用被CUDA加速了数十倍甚至上百倍。JLQednc

英伟达非常聪明,它围绕CUDA建立了一个庞大而繁荣的生态系统。JLQednc

它提供了海量的优化库(如cuDNN、TensorRT)、强大的开发和调试工具、以及完善的文档和社区支持   JLQednc

这个生态系统,就像一条越来越宽、越来越深的护城河,将竞争对手远远地甩在身后。JLQednc

当AMD等对手还在硬件层面追赶时,英伟达已经悄然筑起了一道名为“CUDA”的万里长城。JLQednc

这道长城,不仅锁定了数百万开发者的忠诚度,形成了强大的网络效应和高昂的转换成本,更重要的是,它锁定了未来。JLQednc

任何想要挑战英伟达霸权的公司,都必须面对一个残酷的现实:仅仅造出性能相当的硬件是远远不够的,你还必须重建一个能与CUDA匹敌的软件生态。这几乎是一项不可能完成的任务。JLQednc

第五章:AI加冕:黄金王座上的隐忧

 

历史的机遇,只会垂青有准备的头脑。JLQednc

2012年,AlexNet在ImageNet图像识别大赛中一鸣惊人,深度学习的火焰被点燃,人工智能的“大爆炸”时代瞬间来临。JLQednc

全世界的科技公司和研究机构,一夜之间都疯了,他们疯狂地寻找一种能够满足AI模型训练所需海量算力的“军火”。JLQednc

这时,他们惊恐地发现,这个世界上,唯一的、现成的、也是最强大的“军火商”,只有英伟达。JLQednc

英伟达十年磨一剑的CUDA生态,仿佛就是为AI时代量身定做   JLQednc

它在并行计算领域的深厚积累,使其成为训练神经网络的完美工具。JLQednc

一夜之间,英伟达的GPU从游戏玩家的宠儿,变成了AI研究者和数据科学家眼中最宝贵的战略资源。JLQednc

市场份额说明了一切。在数据中心AI芯片领域,英伟达一度占据了超过95%的份额,形成了事实上的垄断   JLQednc

其数据中心业务收入呈爆炸式增长,几年内翻了十倍不止,公司市值也一路狂飙,冲破万亿、两万亿、三万亿美元大关,成为全球市值最高的公司之一   JLQednc

黄仁勋,这位曾经濒临破产的赌徒,终于登上了权力的顶峰,加冕为硅基帝国的皇帝。JLQednc

然而,王座之下,从来都是暗流涌动。JLQednc

英伟达最强大的客户,同时也是它最大的潜在威胁。JLQednc

谷歌、微软、亚马逊这些手握重金的科技巨头,一边斥巨资购买英伟达的GPU,一边也在密谋“造反”JLQednc

他们不甘心永远向这位“AI皇帝”缴纳高昂的“算力税”,纷纷开始投入巨资研发自己的AI芯片,如谷歌的TPU、亚马逊的Trainium等   JLQednc

这些强大的诸侯,虽然短期内还无法动摇英伟达的统治,但他们的野心,已经为帝国的未来埋下了隐忧。JLQednc

除此之外,还有在美国小院高墙围剿下的中国同行,也正在奋力突破枷锁。JLQednc

帝国的统治,从来都不是一劳永逸的。JLQednc

要理解Nvidia为何能从九死一生的血战中杀出,并建立起如此庞大的帝国,就必须理解其缔造者——黄仁勋。JLQednc

黄仁勋的人生,是一部典型的移民奋斗史。他出生于台湾,9岁时被家人送往美国,却被误送进肯塔基州一所问题少年管教学校。JLQednc

在那里,这个瘦小的亚裔男孩,唯一的任务是每天打扫所有厕所。JLQednc

他被霸凌,被威胁,但他学会了坚韧。他后来的第一份正式工作,是在Denny's连锁餐厅当洗碗工。JLQednc

这些早年的“痛苦与磨难”(pain and suffering),塑造了黄仁勋的核心价值观。JLQednc

他反复对斯坦福的学生说:“我祝你们有足够多的痛苦和磨难。”JLQednc

因为“伟大源于品格,而品格并非来自聪明人,而是来自那些饱受苦难的人。”JLQednc

这种个人经历,完整地投射到了Nvidia的企业文化中。JLQednc

当公司濒临破产时,他能喊出“我们离倒闭永远只有30天”,将生存危机感注入每个员工的血液。JLQednc

这并非夸张,而是他真实经历的写照。JLQednc

他推崇“智识上的诚实”(intellectual honesty),要求团队持续评估决策,一旦发现错误,就必须迅速承认并改变方向。JLQednc

这正是他从NV1的惨败中得到的血泪教训。JLQednc

他敢于押注“零亿美元市场”,因为他信奉“第一性原理”思考,即回归事物的本质,重新思考“如何重塑这一切”。JLQednc

正是这种思维方式,让他看到了GPU超越游戏的可能性,并为之布局十年,最终等来了AI的浪潮。JLQednc

黄仁勋的领导哲学,就是Nvidia的操作系统。JLQednc

CUDA帝国的建立,不仅是一次成功的商业决策,更是一个在苦难中淬炼出的强大意志的体现。JLQednc

这家公司的坚韧、远见和承担巨大风险的能力,都源自其创始人的性格烙印。JLQednc

让他从肯塔基州的厕所,最终登顶到硅谷的算力王座。JLQednc

本文部分引自《心术:算力驱动架构变革》第三章GPU与光影计算,有删改。
责编:Ricardo
文章来源及版权属于歪睿老哥,EDN电子技术设计仅作转载分享,对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。如有疑问,请联系Demi.xia@aspencore.com
歪睿老哥
一个芯片设计行业老哥;忙时研发,闲时写作;聚焦芯片行业的那些事,唯武侠与芯片不可辜负。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
广告
热门推荐
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了