V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
terryso
0.62D
0.74D
V2EX  ›  程序员

解放双手,让智谱手机 Agent 帮你自动化操作小红书

  •  
  •   terryso ·
    terryso · 2 天前 · 1772 次点击

    https://youtube.com/shorts/97TV1EfY9lk

    Phone Agent 是一个基于 AutoGLM 构建的手机端智能助理框架,它能够以多模态方式理解手机屏幕内容,并通过自动化操作帮助用户完成任务。

    项目地址: https://github.com/zai-org/Open-AutoGLM

    14 条回复    2025-12-13 09:39:20 +08:00
    ricwangcom
        1
    ricwangcom  
       1 天前
    可以自动刷抖音的广告,赚积分不
    coefu
        2
    coefu  
       1 天前
    利好那些 MCN 机构,以及一个隐藏流量操控市场。
    coefu
        3
    coefu  
       1 天前
    3. 开发者与用户行为规范





    https://github.com/zai-org/Open-AutoGLM/blob/main/resources/privacy_policy.txt

    严禁利用 AutoGLM 开源项目或基于其开发的应用/服务从事以下行为:
    ( 1 )批量自动化与恶意竞争行为
    - 进行任何形式的虚假数据操作:刷单、刷票、刷赞、刷评论、刷流量、刷粉丝、刷播放量、刷下载量等。
    - 批量操控账号:批量注册、批量登录、批量操作第三方平台账号(群控、多开、云控)。
    - 扰乱市场秩序:恶意抢购、囤积居奇、抢占限量资源、批量领取/滥用优惠券/补贴、恶意占用服务资源(薅羊毛)。
    - 操纵平台规则:刷榜、刷排名、操纵搜索结果、人为干预推荐算法、虚假提升/降低内容曝光度。
    - 制造虚假活跃度:批量发布、转发、点赞、收藏、关注、取关等社交媒体操作。
    - 破坏游戏公平:游戏代练、工作室操作、批量刷装备/金币/经验/道具。
    - 破坏公正性:批量投票、刷票、操纵网络评选、调查结果。
    ( 2 )虚假信息与欺诈行为
    - 制造误导信息:发布/传播虚假商品/服务评价、虚假用户反馈、虚假证言、虚假体验。
    - 伪造商业数据:制造虚假交易记录、虚假销量、虚假用户活跃度、虚假好评率。
    - 身份欺诈:冒充他人身份、虚构个人信息、盗用他人账号/头像/昵称、伪造身份证明。
    - 虚假营销:发布虚假广告、进行虚假宣传、夸大产品功效、隐瞒产品缺陷/风险。
    - 参与诈骗活动:网络诈骗、虚假投资、传销、非法集资、虚假中奖、钓鱼等。
    - 传播不实信息:制造或恶意传播虚假新闻、谣言、未经证实的信息。
    ( 3 )破坏第三方服务与系统安全
    - 非授权访问:利用 AutoGLM 进行数据爬取(违反 robots.txt 或平台政策)、信息窃取、API 接口滥用、服务器渗透测试(未授权)。
    - 技术破坏:对第三方应用进行逆向工程、破解、修改、注入恶意代码、干扰其正常运行。
    - 资源滥用:恶意占用第三方服务器资源、发送垃圾请求、制造异常流量、进行 DDoS 攻击。
    - 违反平台规则:故意违反被操作第三方应用的用户协议、服务条款、社区规则。
    - 恶意竞争:恶意差评、恶意举报、恶意投诉、商业诋毁。
    - 传播有害内容:传播计算机病毒、木马、恶意软件、勒索软件、垃圾邮件、非法内容。
    - 侵犯数据权益:未经授权进行大规模商业数据采集、用户信息收集、隐私窥探。
    ( 4 )侵犯他人合法权益
    - 账号盗用:盗用他人账号、密码、身份凭证进行操作。
    - 网络骚扰与霸凌:恶意骚扰、威胁、辱骂、诽谤、人肉搜索他人。
    - 侵犯隐私与秘密:未经授权收集、使用、传播他人个人信息、隐私数据、商业秘密。
    - 恶意抢注:抢注他人商标、域名、用户名、社交媒体账号等。
    - 骚扰行为:恶意刷屏、垃圾信息轰炸、强制关注/订阅。
    - 损害商业利益:商业间谍活动、不正当竞争、恶意挖角、窃取商业机密。
    ( 5 )滥用资源与破坏项目生态
    - 滥用注册资源:恶意注册大量账号、虚假注册。
    - 浪费计算/设备资源:恶意占用本地设备或云设备资源、长时间闲置占用、运行与自动化任务无关的高耗能程序(如挖矿)。
    - 破坏稳定性:恶意测试系统性能、进行压力测试(未授权)、频繁重启服务、利用技术漏洞/缺陷牟利或损害项目/平台利益。


    堵住了一切不好的念头,😄。
    - 违反开源协议:违反 AutoGLM 项目的开源许可证条款。
    bleeontheway
        4
    bleeontheway  
       1 天前
    今天深度试用了一下 Open-AutoGLM
    使用 AutoGLM-Phone-9B 模型什么情况不知道,本地部署不了,找了一圈也没找到谁提供了 api 的调用方式
    使用其它模型 gpt5, gmini, Sonnet 等都没法正常完成任务,调试发现是按钮的位置不准确,非常不准确。

    这个也是大模型在图片坐标返回时的通病吧
    open-autoglm 在处理坐标是认为模型已经对图片归一化 1000x1000 了,可能其它模型不鸟它吧

    我也按照 https://zhuanlan.知乎.炕母/p/676023813 给的方法修改了提示词并调整了最终坐标的计算算法,但也也没什么太大用处,坐标就是不准确

    可能 AutoGLM-Phone-9B 在对坐标 detect 这方法做了什么特殊的增强吧。 希望早点看到三方部署的 api 上线
    照理来说这么小的模型应该不会太贵的
    duuu
        5
    duuu  
       1 天前
    @bleeontheway 用 glm-4.6v 呢?现在官方 api 是免费的
    dearmymy
        6
    dearmymy  
       1 天前
    这得多消耗 token ?
    terryso
        7
    terryso  
    OP
       1 天前 via iPhone
    @bleeontheway 我的视频里面的操作是使用 glm1-4.6v
    terryso
        8
    terryso  
    OP
       1 天前 via iPhone
    @duuu 4.6v 是可以跑起来
    terryso
        9
    terryso  
    OP
       1 天前 via iPhone
    @dearmymy 你买 coding plan ,基本用不完,不用担心 token 的问题
    yukinotech
        10
    yukinotech  
       1 天前
    应用场景类似于手机矩阵,挂机点赞,刷积分?原来是靠挂脚本,模式比较固定,定制成本高,现在 ai 操作 adb 更加智能了,自然语言操作 adb
    terryso
        11
    terryso  
    OP
       1 天前 via iPhone
    @yukinotech 也可以给自己点杯咖啡,😄
    bleeontheway
        12
    bleeontheway  
       21 小时 32 分钟前
    今天试了 GLM-4.6V ,确实可以。
    它返回的坐标一定是基于 1000x1000 的,犟得狠,无法纠正成其它坐标系。
    terryso
        13
    terryso  
    OP
       19 小时 35 分钟前
    @bleeontheway 目前的确适配得还不太好, 不过既然开源, 应该有人会帮忙解决
    BN5MDKFM
        14
    BN5MDKFM  
       3 小时 4 分钟前
    @coefu 规则和实际执行是两码事,有巨大的浮动操作空间,也就是灰 BLACK 产和 MCN 这种
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2555 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 04:44 · PVG 12:44 · LAX 20:44 · JFK 23:44
    ♥ Do have faith in what you're doing.