WithoutSugarMiao 最近的时间轴更新
WithoutSugarMiao

WithoutSugarMiao

V2EX 第 637956 号会员,加入于 2023-07-11 10:54:39 +08:00
今日活跃度排名 103
寻个队友一起体验一下这个游戏
游戏  •  WithoutSugarMiao  •  1 天前  •  最后回复来自 YFZZ
4
[年度游戏投票] 今年的年度游戏是 33 吗?
游戏  •  WithoutSugarMiao  •  2025 年 11 月 26 日  •  最后回复来自 zhuyihapi
39
现在的主流读书 APP 为什么不提供上下滑动翻页?
程序员  •  WithoutSugarMiao  •  2025 年 11 月 11 日  •  最后回复来自 emiyamuto
9
WithoutSugarMiao 最近回复了
@dawnzhu #31 很正常 因为 AI 的能力太强,如果是小规模应用,完全没有微调的必要,就像 @123zouwen 回复的一样,如果你想在自己的公司使用,那么你懂公司的业务,用通过的 LLM ,用现成的 MCP 、skill ,完全 cover 的住。

但是这个东西的复杂度曲线 就像传统项目一样,你在公司用 你不用考虑 QPS 上来了怎么办,并发度高怎么办,分布式同步怎么办。因为公司就那些人。但是你要想做个企业级项目,比如豆包,比如千问, 那要考虑的东西就多太多了。微调只是最基础的部分。

还有一点就是,可能很多人觉得微调很难,又要理解模型,又得调整参数。实际上现在微调的门槛很低,LLM 发展这几年,早就有傻瓜式微调框架了。甚至一行代码不用写,你都能调出来一个差不多的模型。
@dawnzhu 一定会,我建议你看看 我在帖子里写的项目,阿里云的那个课程或者 hello-agents 。几乎所有的 agent 课程里必然会设计到微调,涉及到大模型的理解。
@yungyu 你说的完全风马牛不相及,你也没点进去我在回复中提到的课程,李宏毅的课 [第八讲:通用模型的终身学习] 你可以先看下。一句话总结,我部署了微调后的小模型进行专门的用户关注点预测,作为一个 function call 来给大模型使用。

我从 1 月份到现在 面试了十多家,拿了三个 offer ,你说的这些框架在面试中完全无人在意,或者说根本不会在意这些框架本身(但是现在大部分的商业级 agent 构建,确实有借鉴最初 langchain 的几大组件)。比如最开始 langchain 最火,你用了,然后 langgraph 又火了,你换不换,autogen 又火了继续换吗?现在 claude / openai 的 SDK 最火 又接着换?那如果后续还有其他框架比这俩 SDK 还火,怎么办呢?

agent 开发的门槛,并不在你说的框架熟练度和前面那个哥们说的 业务适配什么的。给你分享点我常遇到的问题。

你能讲讲 transformer 架构吗? gpt 和 transformer 有啥区别啊?为什么 temperature 会影响输出?
RAG 方面,你怎么做的分块?为什么考虑使用这种分块方式?如何优化召回率?使用 rerank 了吗?能说几个比较有新意的 rerank 方法吗?向量数据库怎么选啊?为啥用 milvus ?稀疏向量和稠密向量啥区别啊? RAG 和微调啥区别啊?你数据集怎么弄的啊?你微调的关键参数都有啥啊?你如何评估微调效果呢? agent 有什么构建模式吗?输出 token 超出了模型限制怎么办呢?

好多好多问题呀,我的感觉是基本围绕着四个方向,基础、RAG 、微调、Agent ,一次正经的面试中,这几个方向是一定一定都会被问到的。
@123zouwen #25 随便给你个场景,上个项目实际中遇到的。甲方是个化工公司,帮他们做老客户激活平台,主线功能就是 从个性化唤醒词到聊天获取销售线索。 遇到一个情况,LLM 分不清楚化工原料到具体产品的映射怎么办? 举个例子 化工原料 乙烯 能生产处 聚乙烯 使用聚乙烯 能做出塑料袋。 怎么让 LLM 理解这些? RAG ? 微调?提示词? 上下文? 模型理解了之后,有没有用 bad case ,有的话要怎么优化?

我在帖子里说的“拦截垃圾邮件 / RAG 项目” ,是 23 年 11 月份 到 24 年 11 月 这段时间的项目,当时的技术栈处于 RAG 刚兴起,agent 还没怎么热,大家都在提示词工程到上下文工程的转变上。其实在前面我应该表达时间段了,可能我没写清楚,我的问题。(我补充一下,虽然是比较早的项目,但是也遇到些比较有意思的问题,但是评论里我就不展开了,因为能写很多内容。)

当然我不是故意怼你的意思。我是觉得你是对 Agent 开发这个行业了解太少了,这也不怪你,毕竟也是 2025 年才刚兴起的。你如果感兴趣,我推荐你 我学习过的几个课程 你可以系统性学习一下。

1. 台湾国立大学李宏毅的 2025 年[最新课程]( https://www.youtube.com/playlist?list=PLJV_el3uVTsMMGi5kbnKP5DrDHZpTX0jT),被誉为中文 AI 圈神课。

2. 看完李宏毅的,可以看斯坦福的[CS336]( https://www.youtube.com/playlist?list=PLoROMvodv4rOY23Y0BoGoBGgQ1zmU_MT_),从 0 开始构建语言模型。

3. 辅助的论文阅读,可以关注李沐的这个频道( https://www.youtube.com/playlist?list=PLFXJ6jwg0qW-7UM8iUTj3qKqdhbQULP5I),他的分段精读 transformer ,我看了好多遍。

4. 不喜欢理论只喜欢实践,也可以看看国内写的这个[hello-agents]( https://datawhalechina.github.io/hello-agents/#/)

还有一些比较零碎的资料或者偏实践的,我在之前帖子里有写,就不放了。

总之,agent 开发,我作为从业者的看法是,已经从 2025 年初的探索阶段,过渡到成体系的标准应用了。至于你说的框架,额,怎么说呢?可能你们企业内用的多些,但是商业级的项目一般不会直接用框架。
@linxl 教程可以看我历史帖子。
@123zouwen #16 我目前专职做了两年以上的 agent 开发了。去年末从上家离职,最近刚确定 offer 准备入职。面试的岗位也全是专职 agent 开发。

“Agent 没有什么高深的技术” 你这句话 让我有点绷不住。
我就是 Agent 开发啊。原来做 python 后端,23 年末 RAG 刚火,在原公司做了一年 RAG ,之后入职 AI 公司做 Agent 。去年年末离职,刚准备入职下个工作,也是专职 Agent 开发。具体可以看我帖子 https://v2ex.com/t/1182394
22 小时 17 分钟前
回复了 vlhwnb 创建的主题 问与答 你们和 AI 聊天多吗?
楼主的帖子让我震惊了一下,我之前从没有关注过自己和 AI 聊天的频率。刚才去看了一下,我现在每天和 AI 聊天的频率已经远超和任何其他人聊天频率的总和了。 好像什么都在问 AI 。工作、学习、听的歌、看的书、写代码、徒步感受等等

哇 我好像和 AI 深度绑定了。
1 天前
回复了 WithoutSugarMiao 创建的主题 游戏 寻个队友一起体验一下这个游戏
@ZeawinL 好的 我试试
1 天前
回复了 WithoutSugarMiao 创建的主题 游戏 寻个队友一起体验一下这个游戏
可以先去 b 站 或者 抖音 看看玩法。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2832 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms · UTC 13:09 · PVG 21:09 · LAX 05:09 · JFK 08:09
♥ Do have faith in what you're doing.