Home Sign Up Sign In

wwhc's recent timeline updates

wwhc

V2EX member #145809, joined on 2015-11-05 06:54:06 +08:00

Today's activity rank 5160

wwhc 提问技术话题好玩工作信息交易信息城市相关

Taalas 推出首款专用 ASIC 加速卡声称实现亚毫秒级推理

分享发现 • wwhc • Feb 23 • Lastly replied by 7gugu

2

Marie Fredriksson 去世了，流行音乐黄金时代的代表乐队 Roxette 不复存在

音乐 • wwhc • Dec 12, 2019 • Lastly replied by KentY

4

寻求中国境内网站开发合作伙伴

外包 • wwhc • May 1, 2018 • Lastly replied by bingod

4

» More topics by wwhc

wwhc's recent replies

9 days ago

Replied to a topic by cwcc › AI Agent 智能体 › 如果为了本地大模型，卖掉 MacBook Pro M3 Pro 36G，买Μ5 Max 128G，合适吗？

重度运行本地大模型的 Mac 要选用 M? Ultra ，即使是 M1 Ultra ，也强于任何世代的 Max 型号

Apr 27

Replied to a topic by junwind › 程序员 › glm5.1， kimi2.6， minimax2.7， mimo v2.5， deepseek v4，编程能力上的排名如何？

@Jiajin
@junwind
不依赖别的工具，本地部署的 Qwen3.6 27B/35B 也能达到 GLM 的水准当使用“帮我生成一个天气查询 H5 应用”这个提示词

Apr 27

Replied to a topic by junwind › 程序员 › glm5.1， kimi2.6， minimax2.7， mimo v2.5， deepseek v4，编程能力上的排名如何？

楼主的测试有偏差，本地部署的 Qwen3.6 27B/35B 使用楼主的提示词都能生成达到楼主图中 GLM 的水准的代码渲染，本地部署的 gpt-oss 120B 倒真是惨不忍睹，生成的的代码渲染出的页面没法看

Apr 4

Replied to a topic by unt › Local LLM › Gemma 4 31B 大概什么水平，本地部署是不是又成为现实了

差一点就能赶上 Qwen3.5 了

Apr 4

Replied to a topic by unt › Local LLM › 为什么 Qwen 吹这么牛，但是用起来体验这么拉啊，它的真实能力究竟怎么样

Qwen3.5 是适于本地部署的开源模型中最强的，Google 昨天新发布的开源 Gemma 4 模型也仅仅是追上 Qwen3.5 而已

Apr 1

Replied to a topic by laikicka › 生活 › 这条不是愚人节新闻：中国全国范围内的“后排乘客不系安全带罚款”政策将推行

罚太少了，我建议至少 5000 起步

Mar 28

Replied to a topic by beimenjun › 分享发现 › 赛博斗蛐蛐 - 大模型写翻页时钟 - Opus-4.6/GPT-5.4/K2.5/MiMo-V2-Pro/GLM-5/Qwen3.5-Plus/某 2.7/某包

Token 自由的感觉蛮不错

Mar 28

Replied to a topic by beimenjun › 分享发现 › 赛博斗蛐蛐 - 大模型写翻页时钟 - Opus-4.6/GPT-5.4/K2.5/MiMo-V2-Pro/GLM-5/Qwen3.5-Plus/某 2.7/某包

经验是用一到两块高性能大显存卡如 3090/4090/5090 ，再加上若干便宜的中低端卡(8-16GB 显存)，把所有层都放进显存（能容纳的上下文越多越好，256k 大概需要 60GB 显存以上），尽可能多的把专家权重放到显存，一般能实现 10-20t/s 或以上的速度，建议使用 llama.cpp 而不是 vllm ，以便于快速迭代及灵活的硬件搭配

Mar 28

Replied to a topic by beimenjun › 分享发现 › 赛博斗蛐蛐 - 大模型写翻页时钟 - Opus-4.6/GPT-5.4/K2.5/MiMo-V2-Pro/GLM-5/Qwen3.5-Plus/某 2.7/某包

本地开源模型的表现：用楼主的复杂提示词，gpt-oss-120b 一次就成功完成了. Qwen3-Coder-Next-MXFP4 用了 5 次才成功,Qwen3.5-397B-A17B-MXFP4 3 次成功完成.成品质量最好的是 Qwen3.5-397B ，gpt-oss-120b 也算可以，但确实翻页有点慢

» More replies by wwhc

About · Help · Advertise · Blog · API · FAQ · Solana · 1411 Online Highest 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 17ms · UTC 16:53 · PVG 00:53 · LAX 09:53 · JFK 12:53
♥ Do have faith in what you're doing.