joe223's recent timeline updates
joe223

joe223

V2EX member #218955, joined on 2017-03-05 10:15:29 +08:00
joe223's recent replies
@yukminnie 💐
@yukminnie 后面其实想做 computer-use 的能力,可以语音交互操作电脑,或者发出指令让 Agent 操作电脑,不知有无这方面需求?
也考虑到本地运行的负载限制,所以目前版本中最多给到 Gemma4 2B 版本的选项
@yukminnie 功能定位上是一回事,但是两者技术上实现不同。一个是 LocalPolishEngine ,另一个是 CloudPolishEngine 。LocalPolish 毕竟是小模型哈,还是不如云端几十上百 B 的大家伙
(但是 2B 以内的本地 llm 模型其实指令遵从性不太行,最好还是别开
@yukminnie 校准一下哈,500 兆主要是本地 STT 模型的占用,如果开启本地 polish 模型的话,估计 >1G 。

如果不是性能非常顶级的机器,我比较建议的使用本地 STT+云端 DeepSeek 。

因为现在做了上下文管理,我个人体感识别校准效果和 typeless 等商业化产品差不多了
@yukminnie 当前用的本地 STT 模型主推 sensevoice ,比较小巧精悍。如果开 polish 的话,很难了,2B 模型才有比较好的表现。建议用 DeepSeek V4 flash , 非常省钱
@yukminnie 1. 国内的化下载模型会走 mirror 站点,是不是开 VPN 了呀? 2. 实时 STT 准确率略低于录音 STT ,所以目前倾向先录制,结束后出结果。为了尽可能快出结果,目前 PCM 数据是流式发送的,基本上 300ms 内出
不好意思,v0.5.1 有点 bug ,等我开完会重新 build 一个 0.5.2
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   867 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 15ms · UTC 19:49 · PVG 03:49 · LAX 12:49 · JFK 15:49
♥ Do have faith in what you're doing.