V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
这是一个专门讨论 idea 的地方。

每个人的时间,资源是有限的,有的时候你或许能够想到很多 idea,但是由于现实的限制,却并不是所有的 idea 都能够成为现实。

那这个时候,不妨可以把那些 idea 分享出来,启发别人。
Aether
V2EX  ›  奇思妙想

关于精确统计你的词汇量/单词量,我有一个也许有趣的想法

  •  6
     
  •   Aether · 2017-12-12 19:40:31 +08:00 · 6036 次点击
    这是一个创建于 2326 天前的主题,其中的信息可能已经有所发展或是发生改变。
    搜索“精确统计词汇量”,大多都是“词汇量测试”,或者“如何提高词汇量”这种。但这都不是我感兴趣的。

    我最感兴趣的还是:“我的词汇量到底有多少?”
    我感到,现在还没有一个工具里可以认真严肃地做到这一点。

    所以我计划开发一个软件(第一期包括 WEB 和 iOS )实现以下的思路:
    1、粘贴输入一段文本,或者通过 URL 抓取正文;
    2、点击你不认识的单词,标记为“不认识”;
    3、读完以后,将剩下的提交为“已认识”。

    经过一些阅读训练之后,可以越来越精确地反馈你的真实词汇量。

    我已经做好了一个 DEMO。通过大约 10-12 篇的单词,帮助我清理出 3000 个已知单词,也让我记住了不少新单词。立马能想起来的比如,fir,来自一篇讲述小兔子的历险记。outright,来自一首著名的诗。还有不少虽然说不出来,但是看见以后能马上想起来。因为这些单词都和一个故事 /场景牢固地绑定起来,形成了更为强烈的情感连接。

    下面是 DEMO 的一个示例界面:


    下面是我的一个阅读界面,展示了我读完以后的状态:
    (对,有些害羞,我的确头一次发现,我可以读完《卖火柴的小女孩》的原文。不一样的感受。)


    我自己的感觉是,一个人的认知能力是有限的。因为受到生词的影响,阅读时的“认知力”被分流了。而一旦有一个辅助系统来接管“生词”这件事,无形中,“阅读力”似乎被提高了,使我可以更聚焦在阅读本身上面。(这只是我的个人猜测)。

    此外,有了这些数据,我希望系统可以自动向我推荐适合阅读的文本(跳一跳就可以达到的,比如,5%-10%的生词量),然后通过反复曝光来提升我的阅读能力、语感和词汇量。

    如果你对这个想法也感兴趣,请发给我一封邮件:aetherwu * gmail.com ,加入到我的测试列表。

    这个想法对很多擅长阅读的大拿们显然是画蛇添足,若有打扰,还望忽略本帖。
    对这个想法有其他想法或者批评的,也还望多多指教。
    感谢。
    第 1 条附言  ·  2018-01-02 13:03:13 +08:00


    发来邮件的朋友也有很多了,邮件沟通变得不是很方便,所以新建立一个微信群。欢迎新老朋友在群里提出使用上的问题、新功能需求,以及相互推荐值得阅读的文章。
    39 条回复    2023-04-02 20:37:18 +08:00
    SkyeX
        1
    SkyeX  
       2017-12-12 19:56:39 +08:00
    不错,不过读一篇文章,我不会的单词得提供翻译把?
    zeanzhou
        2
    zeanzhou  
       2017-12-12 20:39:43 +08:00
    感觉蛮有意思的,应该会有用
    之前用百词斩背过单词,他会提供一些图片和对应的例句辅助记忆,不过其实有时候我觉得他给的图片和例句还是蛮牵强的,不如在文章里看到来的印象深刻,高中的词汇量完全是做阅读做出来的 hh
    SuperMild
        3
    SuperMild  
       2017-12-12 20:56:38 +08:00
    good idea !
    mkstring
        4
    mkstring  
       2017-12-12 20:59:51 +08:00
    good idea !
    Aether
        5
    Aether  
    OP
       2017-12-12 22:09:39 +08:00
    @SkyeX 会的,点击一下就在底部浮动出翻译面板。
    @zeanzhou 对,我也用过百词斩。但弱场景的很快就忘了。
    sharkli
        6
    sharkli  
       2017-12-12 22:12:23 +08:00
    我不在意自己的单词量。
    通过你这个方式 能以后自动帮我把文章里面我可能不认识的单词标记出来,加上释义会比较有用。
    Aether
        7
    Aether  
    OP
       2017-12-12 22:48:58 +08:00
    @sharkli 对,这也是初衷之一。
    codermagefox
        8
    codermagefox  
       2017-12-12 22:55:06 +08:00
    主意很棒,赞一个。就是很奇怪为啥今天才有人想到...这个需求和做法应该已经十多年了?
    xml123
        9
    xml123  
       2017-12-12 22:55:52 +08:00
    有安卓版吗
    huijian222
        10
    huijian222  
       2017-12-12 23:26:41 +08:00
    第一:用户是否有耐心能读完这么多篇,如果有 业界是否有更有效的检测方式。
    第二:KINDLE 的生词本和辅助外语习得能力跟你的描述非常接近。
    solobat
        11
    solobat  
       2017-12-13 00:13:02 +08:00
    Chrome 里有这样的扩展,叫「单词发现者」。就是用户可以划定一个单词范围,比如 4000 以外的词汇都标出来。一开始我也觉得有意思,后来用着发现,对生词的识别需要先将单词还原成原形态,比如去掉复数、过去式、进行时等等,不然换了一种形式,原来的熟词又会被标成生词,这就尴尬了。还原单词形态这个,貌似是难点。
    YvesX
        12
    YvesX  
       2017-12-13 01:57:24 +08:00
    已经有很多外语阅读材料学习 app 了,你的想法适合做成其中一部分。单独拎出来好像不是很有必要。
    WildCat
        13
    WildCat  
       2017-12-13 02:16:27 +08:00
    不错,配合机器学习或者 word embedding 可能可以更有趣。
    CommitOne
        14
    CommitOne  
       2017-12-13 08:13:51 +08:00
    感觉可以啊,期待成品,上面说的时态变化的问题确实,不过有的词典不是有时态变化吗?
    nameryan
        15
    nameryan  
       2017-12-13 09:24:50 +08:00
    不错的 idea,感觉和时下流行的人工智能机器学习结合起来可能更有噱头,但实际应用场景有点局限,可能可以作为英语评测机构的一种方法?或者还有其他推广的场景? 暂时好像还想不到。
    dday
        16
    dday  
       2017-12-13 09:28:19 +08:00
    顶,已发邮件~
    Macbooker
        17
    Macbooker  
       2017-12-13 09:31:38 +08:00
    @codermagefox 难道现在市面上测单词量的不是抽样?测越多肯定越准,但太多也没意义,知道个大概水平就够了。
    最准的当然是拿一个词典挨个测
    sephrioth
        18
    sephrioth  
       2017-12-13 09:42:48 +08:00
    手动赞!
    minamike
        19
    minamike  
       2017-12-13 10:04:10 +08:00
    扇贝阅读?
    beball
        20
    beball  
       2017-12-13 10:43:15 +08:00
    不错的计划,已发邮件
    chuanqirenwu
        21
    chuanqirenwu  
       2017-12-13 10:43:24 +08:00
    想法很好的,配合机器学习,人工智能,推荐系统,可以做很多 in 垂死听的事情。请问 web 版在哪? ios 版可以在 appstore 下到了么。
    vipper
        22
    vipper  
       2017-12-14 07:51:48 +08:00 via iPhone
    不错,已邮件
    swx934
        23
    swx934  
       2017-12-14 16:34:53 +08:00
    这个功能扇贝阅读就有了.
    Tiakon
        24
    Tiakon  
       2017-12-17 02:16:41 +08:00
    不错,已邮件
    Damaidaner
        25
    Damaidaner  
       2017-12-18 10:51:25 +08:00
    不错,支持 LZ,期待正式上线!
    zzj0311
        26
    zzj0311  
       2017-12-19 15:04:46 +08:00 via Android
    意义在哪里。。扇贝刷个一万三四还能拿去吹个逼,能看懂不就行了~
    Axurez
        27
    Axurez  
       2017-12-21 16:05:12 +08:00
    听起来很像我在做的一个东西……我写了一篇文章介绍 https://zhuanlan.zhihu.com/p/31874729
    上线的地址在 https://www.eliseos.org/zh/babel/learn
    Axurez
        28
    Axurez  
       2017-12-21 16:10:38 +08:00
    @sharkli 你可以试试我这个(信息在楼上)

    目前只能严格标记认识、不认识的,没有推荐和联想。释义可以加,但是得自己加,可能可以考虑挂一个开源的词典(不知道有没有)。
    Gothack
        29
    Gothack  
       2017-12-21 18:25:11 +08:00
    赞,已邮件
    sharkli
        30
    sharkli  
       2017-12-21 20:00:25 +08:00
    @Axurez 多谢
    javaluo
        31
    javaluo  
       2017-12-21 22:07:12 +08:00 via Android
    就是这个想法呀,苦于不会写程序
    4396NeverBeSlave
        32
    4396NeverBeSlave  
       2017-12-22 08:22:06 +08:00
    想问下楼主有没有安卓版的?
    tvallday
        33
    tvallday  
       2017-12-25 01:46:10 +08:00 via Android
    一个单词可以有很多种意思的。你以为你懂了某个单词,其实换一句话你就不懂了。最好不要以认识不认识来主观计算自己的词汇量。玩玩可以,但是不是很科学。
    Aether
        34
    Aether  
    OP
       2018-01-02 12:55:52 +08:00
    发送过邮件的各位朋友都已经加入到 TestFlight 了。
    @dday
    @Gothack
    @Tiakon
    @vipper
    @dday
    @beball


    很抱歉现在还只是在实验这个想法,如果大家都觉得有趣,会做安卓版本的。
    @4396NeverBeSlave
    @xml123

    对,之后的辅助方式可能是各式各样的。
    @sharkli

    对,有一点点难度,但应该不是很难,一定会做。
    @solobat


    我也不知道啊(捂脸,可能是太懒了……)
    @codermagefox

    对,很棒的网站!很开心原道有相同想法而且能手动实现的朋友:D
    @Axurez
    Aether
        35
    Aether  
    OP
       2018-01-02 12:56:58 +08:00
    @tvallday 这里的认不认识并不是你是否背下了一个含义,而是看你在阅读过程里是否能理解这个单词的实际意思。如果看不懂肯定会点击查询一下。
    jyf
        36
    jyf  
       2018-01-02 14:35:16 +08:00
    网易有道以前就有个插件可以干这种事
    jagger2048
        37
    jagger2048  
       2018-07-30 11:16:44 +08:00
    想知道题主这个项目的后续发展如何。假设已经能够统计出用户较为精确的词汇量(项目的核心),要怎么通过这个获取而来的数据做文章?是做推荐阅读,还是单纯地提供一个接口供其他项目使用?
    Aether
        38
    Aether  
    OP
       2018-07-30 11:41:36 +08:00
    @jagger2048 推荐阅读对我来说现在还有点难度,属于技术树缺失。目前可能优先计划一个 Feed 阅读器……
    Winner4good
        39
    Winner4good  
       2023-04-02 20:37:18 +08:00
    项目还在做吗
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3253 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 12:44 · PVG 20:44 · LAX 05:44 · JFK 08:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.