V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  slackerman  ›  全部回复第 1 页 / 共 13 页
回复总数  241
1  2  3  4  5  6  7  8  9  10 ... 13  
14 小时 49 分钟前
回复了 imherer 创建的主题 买买买 5k 以内的扫地机器人推荐
@zgsi 追觅的 S50 / X50 Pro 版本带有机械臂辅助的,6 厘米都可以上
大概是网络问题吧。为什么说“大概”?因为我好久没遇到过了。
本质是个同位竞争还是错位互补的问题。
如果能意识到 ai 和人的强项和短板是不同的,那么和 ai 合作无疑是变强了。
如果感受到的是自己会的 ai 大部分都会,ai 干不好的自己也不擅长,那么说明不适合做程序员了
3 天前
回复了 Livid 创建的主题 Google Gemma 4 可以通过洗车测试
就像通过问模型“你是谁”,来判断模型是否套壳注水一样
3 天前
回复了 Livid 创建的主题 Google Gemma 4 可以通过洗车测试
怎么还有人纠结这个问题?所谓“洗车问题”,本质是语义冲突、信息不完备情况下的决策问题。整段题目的表达拆分开来是由四段语义组成。1. 我想去洗车
2. 洗车店离我 50 米
3. 可选择走路去还是开车去
4. 我应该怎么去?日常情景下,这个问题是:我想去洗车,应该怎么去?

第一段其实不用管。第四段我该怎么去?去洗车肯定得开车去吧。这时候再插入第二段:洗车店离我 50 米,其实对这个题目也没有什么影响。因为洗车店无论离我多远,我都得开车去,对吧?最后再插入第三段形成完整的题目:是走路去还是开车去?

这时候就出现了一个语义冲突了。提问题的人提供了一个选择,一个隐含假设:你是可以走路去,也可以开车去。

提问人提出了一组冲突的信息,那回答的人怎么办呢?

两个选择:要么猜,要么要求提问人澄清。
我们先说人怎么办:

1. 凭直觉回答完全忽略隐含的冲突信息
2. 敏锐地捕捉到了冲突信息,去猜到底是哪句话说错了造成的冲突
3. 向提问者要求澄清 LLM 怎么做呢?

在这样的一种陈述句下,LLM 通常倾向于自行去补全上下语境。所以,LLM 其实大概率是走到了 2 的路径。

至于它是怎么猜的,我们不能保证,也是一个概率问题。比如说:
1. 它猜你是不是“50 米”打错了,其实是一个“50 公里”
2. 或者是猜你要洗的车已经在洗车店了
很多人觉得 LLM 回答的答案和自己的预期不一样,是因为人聪明、LLM 弱智,其实根本不是这样。热衷于用这个问题去评判 LLM 的智能程度,反而是因为本身对语言不够敏感,且对 LLM 的运行机制不够了解。
4 天前
回复了 hammy 创建的主题 English AI 好像对学英语没有带来实质性的改变
语言的学习,使用/暴露强度是核心因素,语言学习的效果最终效果要内化到潜意识层面(包括肌肉记忆),工具和方法论可以使你更方便地提升使用/暴露强度,但是不花时间上强度一切还是白搭。
这种学习类型跟骑车、游泳、轮滑、滑雪类似
4 天前
回复了 imherer 创建的主题 买买买 5k 以内的扫地机器人推荐
@slackerman 还有拖布加湿漏水,反正是体验高开低走。反倒是最早的那台石头代工的小米 1s ,不是很智能,发挥却非常稳定
4 天前
回复了 imherer 创建的主题 买买买 5k 以内的扫地机器人推荐
@Ax2022 我就是看他的评测买的 S50 PRO ,刚开始用感觉黑科技是有点强,用久了发现稳定性不太行。奇奇怪怪的迷之操作,低矮区进去了出不来撞传感器死循环到没电,明明有摄像头却推着垃圾走不绕开被卡住,原地迷路转圈圈,半夜疯狂撞门。用起来感觉就像是那种能力明明可以很强,但精神却不太正常的🤦‍♂️
4 天前
回复了 slackerman 创建的主题 Cursor [吐槽] 被 cursor 计费气到了
@walkon 是的,现在到达百分百,高级模型完全不给用了,说可以用 150%~200%的信息已过时
5 天前
回复了 tactac 创建的主题 上海 9 万买一个没有产权的人防车位划得来么?
停车位很紧张,停车位租金却很便宜,这两个条件互相冲突?预计有变量,没有交代清楚
评估的核心变量,停车位紧张就买,有升值可能。不紧张就租,升值概率不大。
3 月 31 日
回复了 techdai 创建的主题 问与答 AI 代码能力这么强,软件收费还有意义吗?
这个思路是不对的,AI 这么强了,软件行业不会停在原地,会产生大量 amazing 的新软件,旧的那些小工具小网站都免费了,但未来仍然需要为新的、更强大的软件去付费。付费不是因为它是软件,而是因为这个软件在使用中产生价值,又有稀缺性。这个特征无论软件行业如何发展都不会改变
公共医疗信息网站是时代的产物,
先不论因为什么原因,国内医疗机构错过了那个时代,现在这个时代已经过去了。
医疗信息的获取入口转向 AI
@GitWatt 感谢夸奖,上面这段是洗澡前时间匆忙,手机输入法键入的,所以没有展开讨论。不过在我看来,说一个人的思维方式和表达与 ai 相似,算是一种荣耀。Appreciate it
@GitWatt 很好,讨论开始触及一些更核心的问题了。基于已有推荐算法的改进方案,类似于长短视频平台,提供的启动流量池。但是有一个不同点是在于,对于长短视频来说,大部分用户是很容易判断自己想要什么,不想要什么的。对于开源项目平台,这里会面临更复杂的判断难度。用户可以通过项目介绍去了解这个项目有没有满足我的需求。但是更深一层,这个项目安不安全,稳不稳定,有没有 Bug ,上手成本如何,交互体验好不好,这类重要问题对于用户来说,验证成本是很高的。所以大部分用户会倾向于选择最热门的、被大量用户反复验证的项目去使用。而去追求对自己需求有更高契合的一个冷门项目去试错不是普通用户的常态。所以,把这些长尾项目分发给普通用户,并不那么容易帮助平台完成项目评价。
所以我的基本判断是,这类事情更适合少数的 KOL 去做。
以上仅仅是这些问题的正面展开,此外,还需要厘清
开发者需要的是“被看到的机会”,
用户需要的是“更低成本找到有用东西”。
这两者被满足的时候,付出的代价是什么,上面之前提到了审核的人力成本,此处应有更多的思考,后续再展开讨论
@GitWatt
我看了这个项目前后的一些描述,其中谈了一些现有机制可能存在的问题,但是新项目的商业逻辑非常模糊(至少没有表达)。
大部分用户内容平台依赖用户互动数据加上算法,形成推荐排序机制的。
这个机制为什么不行,应该改进还是重构
如果跳出这个框架,应该怎么做?
类似 Google 或者 apple 应用商店再做一道审核吗?
这么做为什么会更好?
谁谁来讨论,谁来评价?
谁来为筛选和评价的工作量付费?
谁来为项目的曝光流量买单?
开发者为什么用这个平台?用户为什么用这个平台?
这些核心问题有一些浅尝辄止的讨论,但没有一个找到了有说服力的答案
So to be frank, I'm so confused about why this project could last for five months.
看完这个项目,我的感受是,天呐!这个项目你们做了 5 个月,就没有人阻止你们吗🤦‍♂️。人的注意力是稀缺资源,试图将稀缺资源向长尾分散。。。😮‍💨
3 月 25 日
回复了 liKeYunKeji 创建的主题 互联网 美团误删大量用户的手机相册照片
@haaro 我的美团就是 play 下的🤦‍♂️
3 月 24 日
回复了 meppy 创建的主题 股票 私募量化能买吗?
这问题跟股票能买吗差不多吧,如何回答是好呢🤔
3 月 23 日
回复了 iso223 创建的主题 职场话题 4 offer 选择?
总体而言,选电网要好一点,要深刻地理解社会双轨制运行规则需要一点时间。不过这仍然是一个 very from person to person 的问题,每个人有不同的人生观、价值观,要我就不选一二三
1  2  3  4  5  6  7  8  9  10 ... 13  
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2520 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 15:54 · PVG 23:54 · LAX 08:54 · JFK 11:54
♥ Do have faith in what you're doing.