V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
donotquestion
V2EX  ›  分享发现

我认为的 ChatGPT 的下一个方向

  •  
  •   donotquestion · 2023-03-02 19:58:02 +08:00 · 1631 次点击
    这是一个创建于 664 天前的主题,其中的信息可能已经有所发展或是发生改变。
    ChatGPT 是基于文本的语言模型,做的仅限于文本方面的工作。
    我大胆预测下一个方向是基于视频学习的模型,暂且命名为 ActionGPT 哈哈

    那么这个模型发展逻辑我觉得可能是这样的:

    1 、一个机器人拥有各种基础功能,各个关节具有三维方面的可操作性能力
    2 、ActionGPT 开始学习大量视频,并最终理解一些含义。例如喝水动作,首先是拿水杯,让拥有基础动作的机器人
    通过视频得到分解的动作,并通过模拟,完成这个拿的动作,然后再送到嘴巴,喝下去。
    3 、上面两步完成之时,才是真正大爆发的时代,你甚至有了穿衣服机器人、炒菜机器人、洗澡机器人等等,真正迎来机器人时代,这些只是生活机器人,更恐怖的是延展到其他方面。

    细思极恐,新时代的主题已经很明确了,就是机器人时代,爆发就在眼前。
    4 条回复    2023-03-03 15:45:18 +08:00
    pepsiwant
        1
    pepsiwant  
       2023-03-02 20:04:28 +08:00
    我想的是内容创作,当算力足够高的时候,AI 学习了文本、音频和视频,乃至于人类的各种情感体验,你就随便对 ai 说我要看 XX ,我的嗜好是 YY ,包含 ZZ 元素。AI 给你无限生成。再进一步,我要啥样的语音,啥样的剧情,背景故事、男女主角如何,生成十分钟的短片,还是八十集的连续剧,情感体验,反转几次,是笑中带泪还是黑色幽默,是王家卫当导演,还是毕志飞,不管什么样的元素,秒秒钟给你安排了
    systemcall
        2
    systemcall  
       2023-03-03 00:16:57 +08:00 via Android
    chatgpt 在文本这块并不完美
    比如我问它关于牢厂的问题,它就特别容易卡死,有时候回答到一半就卡壳了,有时候直接报错。最多聊个 2 、3 次就不能再聊下去了
    wa007
        3
    wa007  
       2023-03-03 09:02:08 +08:00 via iPhone
    文生视频,据说已经在做了,但技术上有卡点
    donotquestion
        4
    donotquestion  
    OP
       2023-03-03 15:45:18 +08:00
    @wa007 这个生成视频我不觉得是一个彻底改变性的方向,我觉得方向是机器人学习人的动作并能重复这个动作并理解含义。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4506 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 10:06 · PVG 18:06 · LAX 02:06 · JFK 05:06
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.