V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
udonmai
V2EX  ›  问与答

Readability对网页标题的处理不是很理想,但是又不能够更改,感觉不舒服。有什么方法?

  •  
  •   udonmai · 2012-03-02 16:41:12 +08:00 · 3603 次点击
    这是一个创建于 4667 天前的主题,其中的信息可能已经有所发展或是发生改变。
    13 条回复    1970-01-01 08:00:00 +08:00
    bitsmix
        1
    bitsmix  
       2012-03-02 16:42:48 +08:00
    什么网页
    SeptimusX
        2
    SeptimusX  
       2012-03-02 16:45:15 +08:00
    用这货试了一个网易新闻页面,下面乱七八糟的微博推荐什么也抓进来了,还是回头老老实实用Clearly和Instapaper
    udonmai
        3
    udonmai  
    OP
       2012-03-02 16:51:36 +08:00
    @bitsmix 很多人的博客,豆瓣的日记等等都是标题直接是博客和豆瓣的主标题而不是文章的标题,关键是不能改。。。 T T
    bitsmix
        4
    bitsmix  
       2012-03-02 17:00:04 +08:00
    udonmai
        5
    udonmai  
    OP
       2012-03-02 17:02:16 +08:00
    @bitsmix 直接跳转到豆瓣了。。
    bitsmix
        6
    bitsmix  
       2012-03-02 17:03:37 +08:00
    @udonmai 那你用readability抓一下看看呢?
    udonmai
        7
    udonmai  
    OP
       2012-03-02 17:07:40 +08:00
    @bitsmix 你的ok,但是其他很多不行 这个http://www.readability.com/articles/nfkrvnpi
    udonmai
        8
    udonmai  
    OP
       2012-03-02 17:08:54 +08:00
    @bitsmix 大概它的算法是看长度的。。。 很短的不行。。
    udonmai
        9
    udonmai  
    OP
       2012-03-02 17:10:15 +08:00
    @bitsmix 无论标题还是这个正文,短的都不行。。貌似
    bitsmix
        10
    bitsmix  
       2012-03-02 17:12:15 +08:00
    @udonmai 其实我那个也不ok,除非是我自己登陆我自己的帐号看我自己的日记。
    因为这种情况下没有那个 xxx的日记 那个 <h1>

    不过这种事情也怪不得 readability ,分明就是 html 写的不够规范。

    我觉得, 作为 readability (以及其他同类产品)真的不应该把精力放在如何解析更多更复杂的网页上面,应该是双方都遵循同同一个标准。其实如果网页都按照语义来写,这些问题根本就不存在的。
    udonmai
        11
    udonmai  
    OP
       2012-03-02 17:16:03 +08:00
    @bitsmix 恩,很同意~~~ 本来我打算吧readability当作很重要的知识管理的工具的,除了全部备份到evernote之外,部分文章同不到kindle里,但是标题让我不舒服了哈哈。。不过evernote可以自己改。。

    不知道你有没有备份GR加星文章的习惯又是怎么做的?
    bitsmix
        12
    bitsmix  
       2012-03-02 17:30:24 +08:00
    @udonmai google reader 我都不用了。
    最近知识管理等于没有。
    再有就是,你真的忘记ifttt了?
    udonmai
        13
    udonmai  
    OP
       2012-03-02 17:41:22 +08:00
    ifttt用着。。。 可惜GR加星自动同步到EN格式全乱了。。。 伤心
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5365 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 40ms · UTC 02:52 · PVG 10:52 · LAX 18:52 · JFK 21:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.