• 请不要在回答技术问题时复制粘贴 AI 生成的内容
lynn1su
V2EX  ›  程序员

qwen 也用上 DeepSeek 的缓存技术了。我这居然有 90%了,套餐是 coding plan 的 qwen3.7 plus

  •  
  •   lynn1su · 1 day ago · 3191 views
    coding plan 的成本降下来后会不会向公众开放?
    19 replies    2026-06-24 08:52:23 +08:00
    yh7gdiaYW
        1
    yh7gdiaYW  
       1 day ago
    就前几天没有,被喷惨了后把自动缓存加上了。我这儿 cc+qwen3.7max 的缓存命中率有 92%+
    bbbblue
        2
    bbbblue  
       1 day ago
    缓存命中率和用不用 ds 的技术没关系吧
    用 ds 的是超便宜缓存+长时间缓存(小时有时天级别)
    ifoto
        3
    ifoto  
       1 day ago
    coding plan 还能抢到吗
    chenluo0429
        4
    chenluo0429  
       1 day ago via Android   ❤️ 1
    你在讲些什么啊?能不能先学习下什么是缓存?这些基础知识随便找个 AI 都能给你安排的明明白白,不要在公共场合暴露自己的无知
    anivie
        5
    anivie  
       1 day ago
    是阿里百炼的 coding plan 吗,之前去问他们有没有 qwen3.7 还说没有
    xiaomushen
        6
    xiaomushen  
       1 day ago
    token plan 里有好模型
    coding plan 好像买不到了
    codehz
        7
    codehz  
       1 day ago
    不能只看比例啊。DeepSeek 它的缓存的价格是比较低的。(相对来说)
    mingtdlb
        8
    mingtdlb  
       1 day ago
    国产只有 deepseek 真诚。其他厂商都爱玩套路
    TK6
        9
    TK6  
       1 day ago
    coding plan 是按次数计费的怎么算缓存?
    abc0123xyz
        10
    abc0123xyz  
       1 day ago
    coding plan 给的是 qwen3.7plus 没给 max 版本
    son012
        11
    son012  
       1 day ago
    qwen3.7plus 使用体验不太好吧?我用了 qodercn 的订阅,但是改个东西就一直乱改
    lynn1su
        12
    lynn1su  
    OP
       1 day ago
    @TK6 #9 我对接到我的 newapi 后发现上周是完全没有缓存的,这周缓存命中率突然变得和 deepseek 一样高了
    JerningChan
        13
    JerningChan  
       1 day ago
    缓存难道不是你每次调用 ai 的 api 时,你这次发送的内容和上几次的对话内容有高度重叠的内容,才会缓存命中吗?
    yh7gdiaYW
        14
    yh7gdiaYW  
       1 day ago
    @JerningChan qwen 还真有自己的想法,3.7 max 刚发布时没有其他家那种隐式缓存,必须显式创建要缓存的内容。后来被喷改了后还要嘴硬"隐式缓存命中率不确定(加粗)"。3.7 plus 不知道有没有类似的逻辑
    JerningChan
        15
    JerningChan  
       23h 20m ago
    @yh7gdiaYW 哦?这样吗?那还真坑,我是自己部署 qwen3.6 + 线上用 ds / opus 那些,之前用了几次线上的 qwen3.6-max 那些,消耗太快,一点都不爽😂
    asd999cxcx
        16
    asd999cxcx  
       23h 7m ago
    百炼的 tokenplan 经用么
    nescirem
        17
    nescirem  
       20h 26m ago
    @asd999cxcx 我的百炼 tokenplan 标准版 一周用了 20%,感觉差不多刚好够用 1 个月
    Rorysky
        18
    Rorysky  
       11h 11m ago
    @chenluo0429 缓存就是重复信息输入,问的轮数越多缓存越高,缓存高说明上下文管理不当
    abc0123xyz
        19
    abc0123xyz  
       1h 42m ago
    阿里的 coding plan 是按请求计费的啊,缓不缓存都无所谓
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   5808 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 93ms · UTC 02:35 · PVG 10:35 · LAX 19:35 · JFK 22:35
    ♥ Do have faith in what you're doing.