V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
wensonsmith
V2EX  ›  奇思妙想

看西部世界的一个想法,如果实现一个简单版需要哪些技术栈?

  •  2
     
  •   wensonsmith · 2018-06-25 09:36:12 +08:00 · 6048 次点击
    这是一个创建于 2103 天前的主题,其中的信息可能已经有所发展或是发生改变。
    《西部世界》 第二季中,Robert 说西部世界的不是在开发 host, 而是在解码 Guest。

    之前也有过这个想法,就是把我能记住的所有信息录到一个系统,然后别人问这个系统的时候,我可以给出回答。

    比如我什么时候出生,父母兄弟是谁,小时候的一些事情等等。

    当然并不是达到人工智能那个水平,就是一个简单的问答。 可以理解为个人定制版的 Siri。

    现在可以想到会用到的技术有:

    1. 语音识别,语音合成
    2. 分词
    3. 知识存储检索
    4. 模糊查询


    还需要哪些?

    有没有类似的开源系统可以借鉴,或者思路?
    第 1 条附言  ·  2018-06-25 12:24:13 +08:00
    感觉这东西可参考 Mathematica !
    41 条回复    2023-03-30 08:52:22 +08:00
    stephenyin
        1
    stephenyin  
       2018-06-25 09:44:44 +08:00
    生物信息转数字存储...好难
    learnshare
        2
    learnshare  
       2018-06-25 10:01:02 +08:00
    大脑中的“所有信息”是一个极为恐怖的概念,目前应该比较难有效地获取、存储和使用
    ijse
        3
    ijse  
       2018-06-25 10:03:21 +08:00
    记得几年前发现有一个网站,可以连接你的 twitter 等社交账号,分析你的所有网络活动,等你死了模仿你继续在网上存活...
    liuweisj
        4
    liuweisj  
       2018-06-25 10:15:46 +08:00
    先考虑用什么数据结构来存储这些信息把
    mlhorizon
        5
    mlhorizon  
       2018-06-25 10:18:38 +08:00
    想法挺好的。
    不过请先考虑好如何保护这些隐私级的资料。

    @ijse #3 黑镜子里面有这么一出戏。
    iamsee
        6
    iamsee  
       2018-06-25 10:29:48 +08:00
    帽子的充电技术
    lihongming
        7
    lihongming  
       2018-06-25 11:06:07 +08:00 via Android
    @ijse 这玩意挺恐怖的。以前校内有个意外去世的同学,账号就被他父母继续活跃了,还经常跟人说“我”是怎么死的……于是整个班的同学都不怎么玩校内了。
    iamqiwei
        8
    iamqiwei  
       2018-06-25 11:08:22 +08:00
    @lihongming 这父母真会“玩”
    Lawlieti
        9
    Lawlieti  
       2018-06-25 11:15:17 +08:00
    @lihongming 这么恐怖的吗
    maemolee
        10
    maemolee  
       2018-06-25 11:29:55 +08:00   ❤️ 1
    我觉得这东西很有用,希望有个数据库能把我脑中所有的东西都记录下来,这样我老年痴呆之后,还能自动根据我最喜欢谁来写一个和我心意的遗嘱。
    mayne95
        11
    mayne95  
       2018-06-25 11:36:02 +08:00
    google assistant 了解一下?

    Step 1. Tell your Assistant what to remember
    Say "Hey Google, Remember that <thing to remember>". For example, you can say "Hey Google, remember that my spare keys are in the drawer next to the sink."

    Step 2. Ask your Assistant to remember
    Say "Hey Google, where/what is <thing to remember>". For example, you can say "Hey Google, where are my spare keys?"

    简单场景的问答。
    wensonsmith
        12
    wensonsmith  
    OP
       2018-06-25 12:14:57 +08:00
    @maemolee 对的,这个工具可以给一些老人或者病人使用。 毕竟真正的死亡是世上再也没人记住了。
    wensonsmith
        13
    wensonsmith  
    OP
       2018-06-25 12:16:32 +08:00
    @mayne95 Google Assistant 支持中文不。。。
    mayne95
        14
    mayne95  
       2018-06-25 12:24:49 +08:00
    @wensonsmith 目前不支持,说不定今年中文就成了。中文太难搞 233
    SuperMild
        15
    SuperMild  
       2018-06-25 12:42:29 +08:00
    这不就是一个客服机器人吗
    Baymaxbowen
        16
    Baymaxbowen  
       2018-06-25 13:03:50 +08:00 via Android
    @SuperMild 客服机器人没有记忆功能啊,LZ 是需要一个类似大脑备份的东西,哈哈😄
    bestkayle
        17
    bestkayle  
       2018-06-25 13:06:34 +08:00 via iPhone
    @mayne95 #14 然而搞定人工智能的难度比搞定中文的难度高上百亿倍
    samaxu
        18
    samaxu  
       2018-06-25 13:45:36 +08:00
    @ijse #3 黑镜有一期和这个好像
    php01
        19
    php01  
       2018-06-25 13:54:58 +08:00
    人和机器始终不同,如果说要用什么技术,我觉得最重要的技术是赚钱,需要足够的钱召集全世界最顶级的研究生物神经元的专家与计算机科学家们一起研究,这当然不是一两代人能做出来的东西,所以还要有足够的钱让这些专家的研究成果传承下去,培养更多的年轻人参与到这个行业里面来。
    gloryson
        20
    gloryson  
       2018-06-25 14:47:07 +08:00
    意识副本
    herozhang
        21
    herozhang  
       2018-06-25 15:25:14 +08:00
    研究出来做啥?
    为啥不直接研究纯电子化意识,还要肉体做啥??
    肉体这种低端形态完全不适应未来的星辰大海啊
    mayne95
        22
    mayne95  
       2018-06-25 15:48:55 +08:00   ❤️ 1
    对这类话题比较感兴趣,再啰嗦两句 233

    楼主其实已经把技术列的差不多了,如果要做个人助手的话,我结合我所知道的可用技术,梳理一下流程。

    首先是语音输入和识别的问题,推荐这个平台 https://dialogflow.com/ 以前叫 api.ai 后来被 google 收购改名了。现在整合了各大平台接口,可以非常方便的开发语音助手。只要有个手机 app,来提供语音输入输出就行了。后面的逻辑处理你可以自己实现。

    这个平台提供了,分词和归纳的功能。比如你问,今天北京的天气怎么样。 分词后"北京"会被归纳到 地点类型,当成一个属性。然后你调用自己接口处理的时候,可以把这些信息都传进去。

    语音助手的实质是对话,对话的基础是理解上下文。比如上面的问天气,如果不知道地点,回答起来是牛头不对马嘴的。分词之后,北京作为一个地点属性,存储在上下文中,当前对话的地点就是北京。

    你也可以自定义属性,或者为属性添加词条,比如为"地点"添加一个不知名的小地名。

    楼主提到技术 1&2,已经有成熟的解决方案了,不用自己再造轮子了。

    技术 3&4,楼主或许可以结合你附言中提到的那个东西吧,我不怎么了解。

    关于数据存储,因为没有像西部世界里面那种高科技的帽子,数据的录入只能依赖于日常生活中的积累。

    我觉得可以这样搞,如果是 社交网络癌的话,现有的数据已经很多了,其中少部分包含对待某事物的情感。可以想办法导出来,算是情感类的数据吧。

    可以用 IFTTT,记录社交活动,自己存储起来,用作日后的数据分析。比如有个推是骂 xxx 的,然后你点了赞,通过感情词汇的分析,就可以得到你对 xxx 的态度,然后存储起来。

    这个时候你有了人名:xxx,态度:讨厌。再到后面你问助手,我对 xxx 的看法时候,检索对应的信息就 ok 了。

    知识类的数据,因为已经有一部分公共的知识(维基百科等)了,这些接口很多就不列举了。 真正自己产出的知识,我 倾向于建立自己的知识库。因为这是你自己真正有特色的东西。如果已经有写 blog 的习惯了,有观点输出,这部分的数据也就有了。如果没有的话,你要自己考虑一下你的知识库该怎么建。个人推荐 notion,现在出了表格真的很好用。
    lyz745704689
        23
    lyz745704689  
       2018-06-25 16:01:59 +08:00
    @ijse 那没死之前,这个网站有卵用呢...
    onbeam
        24
    onbeam  
       2018-06-25 16:57:56 +08:00
    将自己的意识上传。然后脱离躯体,做一个网络幽灵。
    luoway
        25
    luoway  
       2018-06-25 17:49:36 +08:00
    @onbeam 意识是什么都不知道,就开始科幻意识上传了。
    saulshao
        26
    saulshao  
       2018-06-25 19:57:43 +08:00
    我一直有一个梦想,就是在我死之前能实现一个智能程序,模仿我活在互联网上,即使不能和人见面,玩玩 facebook 也是好的。
    civet
        27
    civet  
       2018-06-25 20:41:30 +08:00 via iPhone
    AIML
    elvodn
        28
    elvodn  
       2018-06-25 20:51:30 +08:00
    Amadeus
    onbeam
        29
    onbeam  
       2018-06-25 21:03:44 +08:00
    @luoway 思维意识应该算是一种脑电波,最后应该还是可以被数字化。
    GTim
        30
    GTim  
       2018-06-25 22:08:08 +08:00
    @saulshao

    我最近在调教我的天猫精灵,就是类似这样的,不过好难,识别率好低

    最坑的一点,就是他完全没法理解,我小时候的故事,我与外婆的故事

    我小时候的故事,就三个关键点:我 小时候 故事
    我与外婆的故事: 我 外婆 故事

    我 需要生物信息识别

    小时候,需要年龄界定

    外婆是参与者

    所以,其实就是什么人在什么地方什么时候与其它什么人怎样做了一件什么事

    不过这种实现起来还好,但如果要在网上留下印记,那还是太难了..
    inflationaaron
        31
    inflationaaron  
       2018-06-25 22:32:08 +08:00
    要实现这样的玩意很明显就涉及到人工智能了。因为不是所有的输入都是规范性的,因此这个系统不仅需要明白每一个字说得是什么,更需要理解词语之间的联系和指代关系。这就进入 NLP 的领域了。如果你不要这种界面,那搜索引擎已经完成了剩下的工作。
    cqhme
        32
    cqhme  
       2018-06-26 04:32:56 +08:00 via Android
    莫名想起了 浣熊市的“红皇后”
    and
    终结者里的 skynet
    😂
    cqhme
        33
    cqhme  
       2018-06-26 04:34:40 +08:00 via Android
    @mlhorizon 嗯 圣朱尼佩洛 这集有点暖
    luoway
        34
    luoway  
       2018-06-26 11:22:17 +08:00
    @onbeam 脑电波是电波,是媒介不是产生源,是被观察的现象不是现象起因,是信息不是信息源。
    意识从来未来都不是脑电波。
    monimonipo
        35
    monimonipo  
       2018-06-26 16:26:18 +08:00
    @onbeam 脑电波应该是属于意识的副产品,意识本质应该是各种生物电化学反应以及构成反应的物质。
    geying
        36
    geying  
       2018-06-27 10:32:46 +08:00
    @onbeam 超级骇客?
    taurenshaman
        37
    taurenshaman  
       2018-06-29 16:56:45 +08:00
    只要不是把各种规则进行硬编码,就涉及到知识的定义、构建。

    这个大概就属于 [知识系统] 的符号学派了,可与参考:
    楚辞: http://www.chuci.info

    知识系统还有很多其它学派。最有名的可能就是 Alpha GO 为代表的产品

    https://www.leiphone.com/news/201712/etoCoUwMbaYaIpKI.html
    PerFectTime
        38
    PerFectTime  
       2018-06-30 11:05:40 +08:00
    歪个楼,那如果有两份数据一样的“你”,都认为自己是真的“你”,另外一个“你”是假的呢
    a174871
        39
    a174871  
       2023-03-29 14:40:25 +08:00
    请问 Mathematica 是指什么呢,我搜索了一下是个数学方面的软件?
    wensonsmith
        40
    wensonsmith  
    OP
       2023-03-29 18:18:53 +08:00
    @a174871 #39 https://www.wolfram.com/mathematica/

    对的,就是这个东西。这个东西对真实世界进行建模
    a174871
        41
    a174871  
       364 天前
    @wensonsmith #40 原来如此,超出了我对它的想象力(我以为是一个类似 matlab 的软件) XD
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2941 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 15:09 · PVG 23:09 · LAX 08:09 · JFK 11:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.