V2EX › zizon 的所有回复 › 第 1 页 / 共 22 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

For Existing Member Sign In

1 2 3 4 5 6 7 8 9 10 ... 22

❮

❯

2 天前

回复了 xieqiqiang00 创建的主题 › 分享创造 › 一切可消费内容都由 AI 生成的系统

李飞飞没搞定的世界模型让 PO 主实现了.
卖给游戏公司起步一个小目标吧.

3 天前

回复了 EmberSpirit 创建的主题 › 职场话题 › 吐槽一下某种现状, 关于招聘卡年龄

deepseek v4 flash 够用的情况下还不是有人挤破头上 opus 4.8

4 天前

回复了 awesomePower 创建的主题 › 问与答 › 站里有信仰宗教的人吗？平时生活是怎样的

可以看看这里的信徒:
https://www.v2ex.com/t/1219079
https://www.v2ex.com/t/1219161

11 天前

回复了 intoext 创建的主题 › 中文 › 为我的无知感到羞愧

其实你只要想想就明白.
只有人数和能力到一定程度了才会有显著的反华运动.

任何一个不达标都是静悄悄消失的.

另外那个帖子对中文也是有很多谬误和想当然.

国外游戏官方支持中文才几年,这边自己开始声称中文不代表中国了.

国外对中文的什么态度,电影里有说.
甚至你去新加坡这个号称华人多数的国家也清楚知道中文到底属于什么地位.
更别说那些抱着润想法脱离母国关系的,能对中文有什么好感了.

说白了,国外软件有原生中文支持/语言模型能输出中文还是就是靠宏大叙事的国力支撑的.

11 天前

回复了 dys0327 创建的主题 › git › 有一个 git 仓库合并问题，不知道怎么办才好

仓库 B 叠个改名的 commit 然后 rebase 到 A?

11 天前

回复了 superJava 创建的主题 › 问与答 › 张雪机车真的被针对了吗

赢几场场是新手保护期,输一场就是均值回归.
谁都有屁股,怎么选就是另外的问题了.

所以,规则上有没有没针对不好说,舆论上有没有就难说了.

5 月 26 日

回复了 craftx 创建的主题 › 问与答 › 如何矫正互联网平台传播在可可西里投喂野生动物的行为？

投喂是因为有流量有话题能出片.
你想个反投喂也能出流量能发朋友圈的就行.

5 月 19 日

回复了 shendaowu 创建的主题 › ☕Vibe Coding🤖 › 需求写得太细效果反而更差的原因是什么？有没有改善的方法？

你多看 DeepSeek 的 CoT.它对 reasoning 有些过于细节.
很多你表述上略模糊的点它都要评审推导.

比如把小函数 inline 了.
它会对那些调用多次的小函数反复思考要不要 inline.
一边是强调用户的遵从字面意思(指令强跟随),一方面又再考虑结合工程实现想用户的真实意图(指令意图展开).

5 月 18 日

回复了 iqoo 创建的主题 › 程序员 › 只有 3 个运算操作的解密函数，破解奖励一杯咖啡

@iqoo 既然你说 n 这个强度值是可替换的.
那么 n=0 应该也是等价的.

说明你也根本没有一个快捷算法能够算出来.

5 月 18 日

回复了 iqoo 创建的主题 › 程序员 › 只有 3 个运算操作的解密函数，破解奖励一杯咖啡

The key mathematical insight: the mod 100000 sequence must repeat within ≤100001 steps (only 10⁵ possible values). Found cycle starting at step 248, length 14. Then:

n = 10¹⁴ → idx = 248 + (10¹⁴ − 248) mod 14 = 254
Only 254 iterations needed instead of 10¹⁴
Answer: x99826

deepseek v4 flash ~ 23min
126,935 (126,656 prompt tokens + 279 completion tokens)

5 月 10 日

回复了 jiangzhaosen518 创建的主题 › 职场话题 › 发现一个现象：海外招聘平台仍然大量雇佣 UI 设计师，这是为什么？

你这个问题就像问为什么 1926 年的国人为什么还马拉车而不是汽车.

5 月 9 日

回复了 dxs7732 创建的主题 › 问与答 › 疑问：如果给国内用户在 ai 聊天类程序使用国外的模型，被举报会被拉取喝茶吗？

数据出境方面可能也有合规问题.

4 月 27 日

回复了 hkiJava 创建的主题 › 生活 › 兄弟们,帮忙分析一下,是我的问题,还是这个女生有作的现象

你再想想这是不是国庆想跟你回老家的意思.

4 月 23 日

回复了 JimLee0921 创建的主题 › 电动汽车 › 我觉得比这个什么问界趴窝更奇葩的是这个豆包 AI，看完雷军得被当场气晕

说明不了什么.小米有个玄武芯片,事件又涉及车.

4 月 16 日

回复了 waldentree 创建的主题 › 程序员 › 字节为啥不出个国内版 Vercel？

字节:你这个能产生什么价值

4 月 13 日

回复了 mengyaoren 创建的主题 › 生活 › 每天收到几个电话，说是从豆包搜索过来的

把豆包当搜索用,LLM 现编刚好撞上你的号码吧.

3 月 29 日

回复了 cpalead 创建的主题 › DeepSeek › 为什么 deepseek 的源代码只有几个文件？

1. generate.py 描述了数据/权重文件怎么加载的.
2. model.py,尤其 Transformer 类描述了模型结构/层等怎么构成的信息.
3. kernel.py 描述了 2 里用到的一些核心自定义算子.

给你 2+1 类似与给了头文件声明和.so 文件.

开源的是这个.h.

4. 更接近一些你理解的开源的是有些会提供 finetune.py,做微调的.
这个会告诉你一部分真实完整训练场景下,input/训练数据大概长什么样.
理论上,你有可能根据这个数据格式,去完整重新训练一个等价模型,前提是有对应的硬件资源.

但,通常来说 fintune.py 暴露的信息是不够的.
之所以叫微调,也就是因为它只是一部分 input 长这样.

你可以看看 olmo 的 train.py,比较符合你的对开源的想法.
属于一个端到端,理论上你有硬件条件就可以从 repo 完整复刻的开源形态.
https://github.com/allenai/OLMo/blob/main/scripts/train.py

你说 1/2/4 够不够.
也不能说不够吧.

但 pretrain 的 datasource 直觉上还是很影响跟模型交互的语言/prompt 风格的.

3 月 27 日

回复了 gotOwt 创建的主题 › 职场话题 › 问个问题，国外女职工怀孕了，政府会补贴钱给公司吗？

因为国内不允许开除孕产哺乳期员工.
所有有了钻这个漏洞的人.
反过来企业会对孕产哺乳期员工增加额外道德风险成本.

3 月 27 日

回复了 cutiechi 创建的主题 › 宽带症候群 › Clash 里看到一条奇怪的 UDP 外连，源 IP 还是 10.x，有点看不懂

容器或者某种 sandbox 隔离的 network namespace 里的进程发起的吧.

1 2 3 4 5 6 7 8 9 10 ... 22

❮

❯