V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
V2EX  ›  xiaomushen  ›  全部回复第 3 页 / 共 18 页
回复总数  360
1  2  3  4  5  6  7  8  9  10 ... 18  
13 天前
回复了 aikilan 创建的主题 程序员 Claude Fable 用了么?感觉怎么样?
没事儿,反正会有一群教徒顶礼膜拜的
14 天前
回复了 aikilan 创建的主题 程序员 Claude Fable 用了么?感觉怎么样?
边际效应
一看就不想用的样子。。。
14 天前
回复了 mingtdlb 创建的主题 Local LLM 现在大模型主流都用哪些 nVidia GPU?
@zzutmebwd 没办法呀,国内对公,只能吃这个价。现在都快 10 万了
14 天前
回复了 mingtdlb 创建的主题 Local LLM 现在大模型主流都用哪些 nVidia GPU?
@zzutmebwd 我 7 万多买的
14 天前
回复了 mingtdlb 创建的主题 Local LLM 现在大模型主流都用哪些 nVidia GPU?
pro6000 真的爽,本地做一些 bert 训练完全够用
@xiaxichen NPU 是旧时代的延续,那时候寒武纪大火,静态图的 Tensorflow ,yolo 之类,在 NPU 上跑得很好。大家都觉得 GPGPU 落伍了,纷纷发展 NPU

谁知道之后动态图大行其道,尤其是 LLM ,NPU 架构自然就落伍了呗。
14 天前
回复了 widowcat 创建的主题 程序员 现在 ai 能写报表 sql 吗
@widowcat 这种都是小事情
@coolair 谁会自己找不痛快用 HW 计算卡呢?还不是为了吃饭,甲方信创涉密机房,买了 HW 卡,丙方外协牛马捏着鼻子骂骂咧咧捣鼓
@zhanying 那玩意儿就是个大号 NPU ,根本不适合跑动态图的 LLM 。950 倒是改成 SIMT 了( GPGPU ),还号称兼容 CUDA ,不知道效果咋样。

我觉得 910 就是 HW 抄袭寒武纪 NPU 后,最终的进化形态。结果发现 NPU 这条楼基本是死胡同,一咬牙改换门庭,走 SIMT 路线
@runzekk 又不是搞 LLM 底层的清北本硕,普通码农打工仔,润出去也没人要啊,只能和老墨一起修草坪
@VeteranCat 国安,涉密,信创。这样的大前提下,就别想 N 卡了。捏着鼻子搞国产卡叭...
@runzekk 也不能这么说呀。总归吐槽吐槽咯,虽然从国家安全的角度上说,能理解信创。但此刻国产计算卡实在是太难用了。而且尤其是 NPU 线路的,当下的昇腾卡,搞基于动态图的 LLM ,哪怕是做推理,也是接近扯淡的存在:累死 AI Infra 打工仔

PS:也理解西大不允许用 Huawei 的通信设备---国安角度
@xiaxichen 没用,涉密单位不能连外网,物理隔离的。所以才需要本地信创算力。
真的是一言难尽啊,再说了,正规渠道层面,老美也严禁出售计算卡给那些单位,抓到后,全球追捕全链路经销商,也是神经病。。。
@xiaxichen 涉密单位不允许连外网呗
@xiaxichen GLM5 ,MoE 744B ,激活 40B ,Q8 部署,单卡显存倒是能满足了。这速度嘛。。。很符合昇腾的实际表现
@elehayym1618 昇腾的理论算力只能用在静态图上,比如 TensorFlow,Yolo 上。对付 LLM 这些动态玩意儿,真的无解
@cpper 信创不见得是蛀虫,而是属于没办法。要么让我国放弃国产化诉求,放弃和华盛顿对抗。要么只好捏着鼻子用现阶段的信创产品。有啥办法呢?

反过来说,谁不想用 N 卡呢?
@cpper 关心就关心呗,那你能说服北京那边,要求信创单位购买 N 卡么?
@cpper 又不是你口袋里的钱,有啥浪费不浪费的。哪怕外企里买了 H100 部署,你能保证大部分情况下,不是浪费么?
1  2  3  4  5  6  7  8  9  10 ... 18  
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5812 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 28ms · UTC 02:38 · PVG 10:38 · LAX 19:38 · JFK 22:38
♥ Do have faith in what you're doing.