懂芯片的解惑：为什么英伟达可以造出可以训练 AI 的 GPU，其他芯片公司造不出来吗？

27 条回复 • 2024-06-04 05:09:08 +08:00

1

Inn0Vat10n

207 天前

就是造不出来，就算有一些场景下匹配的性能，也被 CUDA 这护城河拦住了

2

quake0day

207 天前

1

20 年前你也可以问为什么只有英伟达可以称霸游戏显卡行业。为什么 3Dfx, ATI 都没能干掉 Nvidia 。

3

malusama

207 天前

造的出来. 问题是前十年根本没人投资做方便通用计算的代码, 方便的调用 GPU 获得廉价高效的算力
英伟达在做就有了. 现在 AMD 仿照 CUDA 也在做
你做出来芯片了得有人给你写应用代码啊,
google 家开始 tensorflow 是很厉害, 还可以使用他们家 TPU, 问题是为啥最后大家都喜欢用 pytorch

4

k9982874

207 天前 via Android

1

你看 nv 是爆红，实际 nv 布局显卡计算 10 几年，曾经还差点因为这事资金断掉差点破产

5

hGaHLRyC

207 天前

做浮点算力卡的人多，但有 CUDA 的只此一家，而大家都用 CUDA 。

6

phrack

207 天前 via iPhone

任何需要多人多组织协作的行业多半最后都会只剩一家或者一种技术占据 50%以上的份额，不然在这家公司用了这个技术，换一家公司就要换一套技术，社会运行和公司运营成本就会上升，个人发展也会越走越窄。

NV 耕耘多年，CUDA 无出其右，目前很难撼动。其中主要是 CUDA ，硬件现在公版甚至开源设计都很强了，但是软件是一个比硬件复杂的多的生态。

Chrome 浏览器最近几年强推 Manifest V3 但是根本无人能站出来挑战也是因为浏览器这个生态已经太复杂了，没有几百亿几千亿投入连个水花都起不来。希望 Firefox 能扛起大旗吧。

7

ladypxy

207 天前 via iPhone

1

不是其他公司造不出来，是其他公司的性价比不行。同样价格下的算力功耗比不过。

8

LeeReamond

207 天前

矩阵推理核心恰恰是最容易造的，因为结构简单。

问题只是，造 GPU 容易，但你要重新实现一大套科学计算生态吗。。。

9

murmur

207 天前

NV 真的是亲自下场做生态，大概 1060 那个年代 cuda 就有雏形了，你听说大模型都 3090 了

10

Greendays

207 天前

怎么就造不出来了？ AMD 不是有 MI300 么，性能比 NV 更强，大厂都是自有的生态，可以不用 CUDA 那一套。

11

kokutou

207 天前

amd 算力也够, 但是生态已经在 nv 上建好了...
你有钱有时间有人重新造轮子吗?

12

msg7086

207 天前

能造，但代价是什么呢，钱啊。你投 50 亿进去搞，马上就能给你搞出来差不多的东西。
CUDA 壁垒算什么，只要有钱，把 CUDA 上的生态全部重新搞一遍出来就行了。

但现实是，没有钱。

这其实很像 iPhone 上的生态。人家是第一个造出来的非开源智能手机系统，于是手机 App 必有 iOS 的份。安卓是第一个造出来的开源智能手机系统。你看看 Windows Phone ，第二个造出来的。第二个，而不是第一个，所以就寄了。

AMD 现在的定位就是想搞第一个开源的显卡计算生态（ OpenCL/ROCm ），能不能搞成就看天了。但是他有个很大的弱点，就是企业不一定买账开源生态。企业不是普通用户，对开源项目的选择考量是不太一样的。

13

wulili

207 天前

不是造不出来，主要是软件生态不好造，别人都习惯了用 CUDA 。
不过这种状态应该不会持续太长时间，天下苦 N 卡久矣。

14

mcthpj

207 天前

话说, 如何看待老黄乳了热度被打压, 本来前天看到这新闻还挺兴奋, 结果一通搜貌似都没看到有上热搜, 只有寥寥看到有些讨论

15

Cooky

207 天前

生态是没法弯道超车的

16

polobug

207 天前

跟 linux 消费级永远干不掉 win 一个道理呀

17

june4

207 天前

因为起了个大早，且高算力突然被需要，运气逆天。
再过几年就知道了，暴利只能是突击得到无法躺平持续，到时要么有统一的和 cuda 对干的 api,要么各家都做起来了

18

lDqe4OE6iOEUQNM7

207 天前

虽然谷歌有 TPU ，但 TPU 主要用于谷歌内部的 AI 训练和推理服务。虽然谷歌提供了 TPU 服务（如 Google Cloud TPU ），但其生态系统和市场渗透率远不及英伟达的 CUDA 和 GPU 生态系统。
高通的 NPU 主要用于移动设备上的 AI 推理任务，其性能和用途与英伟达的 GPU 不同，且高通并未在 AI 训练领域投入大量资源。
AMD 虽然也有 GPU 和 NPU ，但其软件生态系统和市场推广不如英伟达。AMD 的 ROCm （ Radeon Open Compute ）平台虽然提供了类似 CUDA 的功能，但其生态系统和支持的广泛性还未达到英伟达的水平

19

laminux29

207 天前

历史原因。

1.CUDA 当年是一个第三方的爱好者搞出来的，不是 Nvidia 搞出来的。

2.老黄当年看到这个事情的潜力，向管理层申请，但管理层觉得风险大且鸡肋，就没同意。
老黄是坚持了很多年，背负了很多责任，搞定了很多别的大事，最后管理层才同意老黄搞这事的。

20

me1onsoda

207 天前

可以造吧，有技术优势。用老黄的话说，你的 gpu 就是免费卖也卖不过我。建一个数据中心我省下的电费比 gpu 那点钱多太多了

21

EIJAM

207 天前 via Android

@mcthpj 有没有乳要听指挥。“我不要你觉得，我要我觉得”

22

EIJAM

207 天前 via Android

1

07 ～ 08 年左右，英伟达就到大学开 CUDA 宣讲会了，多年布局，至少领先其他厂商至少十年以上。

23

gpt5

207 天前

在只考虑商业的情况下，nvidia 的方方面面的综合性价比最高。
但别家也不是没得搞，尤其是在"脱钩"的大环境下。
所谓“gpu 通用计算的生态”，其实专注 ai 这个领域的话，也没那么“通用”。

24

PrinceofInj

207 天前

@EIJAM #22 大概是在 05 还是 06 年的时候，我还闲的没事干参加 seti 项目，那会儿就已经有人拿显卡计算了，那算力力压一堆 CPU ，搞得大家都说用 GPU 是作弊，要给人家封号。

25

Mikawa

207 天前

老黄不知道花了多少钱去开发、推广 CUDA ，我上大学的时候有个课老师还带着我们在 NV 的平台上跑了异构运算的 demo ，都是钱啊...

26

e3c78a97e0f8

206 天前

主要还是生态的问题
AMD 也造显卡，但是它的 ROCM 一堆的 bug

27

yzbythesea

206 天前

驱动很重要啊，一个是性能一个是生态。AI 是个产业链，不是光有硬件堆料刷 spec 就能制霸的。就好比 PS5 那破显卡连 7600XT 都搞不定，但是索尼的 3A 大作 PS5 上丝滑，顶配 PC 能给你各种卡顿 bug 。因为写游戏的用 PS5 很多底层 API 优化渲染，但是人家不会给你 DirectX 或者 Vulkan 优化。这就是生态，Nvidia 一样的。