V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Gandum
V2EX  ›  问与答

有没有使用 Feed43+Yahoo pipes+feedly 来监测无 RSS 的网页的朋友,最近遇到一些问题

  •  
  •   Gandum · 2015-05-17 14:22:45 +08:00 · 3169 次点击
    这是一个创建于 3510 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近使用Feed43+Yahoo pipes+feedly来监测无RSS的网页,出现了Feedly中不显示文章内容的现象。
    例如用feed43为轻之国度-最近更新轻小说生成一个RSS地址
    然后把它放到Yahoo pipes里面去抓取全文,得到一个新的RSS地址
    这个RSS地址无论是订阅到The Old Reader,还是Inoreader,还是Newsblur,还是用浏览器直接打开查看xml文件,都是成功的,都可以看到全文。唯独Feedly会失败,变成这样:

    这个问题还有如下特点:
    - 如果是本来就有Rss源的网站,经过Yahoo Pipes抓取全文后,基本上不会出现在Feedly中无法看到内容的情况(但部分文章也会出现)。而我用的抓取全文的方法都是一模一样的,应该不是方法差异造成的。
    - 经测试,订阅到The Old Reader,Inoreader,Newsblur均无问题。
    - 不只是我一个人遇到问题,在Yahoo的论坛上发现了一篇贴子,上面有部分人也遇到这个问题。
    附上相关Yahoo Pipes:
    希望各位能够教教我如何修改Yahoo Pipes使得Feedly可以接受。因为手机上最习惯的Newsify只能和Feedly同步啊,而且Feedly的saved for later还不能导出。

    13 条回复    2015-05-20 17:26:18 +08:00
    Gandum
        1
    Gandum  
    OP
       2015-05-17 17:20:31 +08:00
    没人?
    yeyeye
        2
    yeyeye  
       2015-05-17 22:52:43 +08:00
    以前用pipes生成过全文rss 好像没什么问题 因为是长期用feedly的 所以基本肯定以前是没问题的 后来那些源的配置我没更新 现在也就没有了。

    目测了一下 pipes输出的全文部分似乎有点不太规范,正常情况下有<>之类符号的内容是要用<![CDATA[包起来的。

    要不你自己在内容里面加入这个标签包起来试试??
    Gandum
        3
    Gandum  
    OP
       2015-05-17 23:52:52 +08:00
    @yeyeye Yahoo Pipes的做法是把description的内容全部url编码,而且对于本来就有Rss源的网站,经过Yahoo Pipes抓取全文后输出到Feedly里面就没有问题,只是Feed43的才有问题,很奇怪
    yeyeye
        4
    yeyeye  
       2015-05-18 00:01:50 +08:00
    @Gandum 直接pipes做rss和全文嘛,不经过feed43不是很好么
    Gandum
        5
    Gandum  
    OP
       2015-05-18 00:14:25 +08:00
    @yeyeye 原来还可以这样啊,求教一下怎么操作?应该用哪一个可以用来生成RSS?貌似我使用的教程有些过时啊
    caomu
        6
    caomu  
       2015-05-18 05:01:10 +08:00   ❤️ 1
    feedly的兼容性问题。。。用feedburner重烧可能能改善。。。

    尝试一下把item.description来个rename/copy as成content:encoded。
    dz225
        7
    dz225  
       2015-05-18 09:46:29 +08:00
    @Gandum 直接 xpath fetch page - loop - rss item build
    Gandum
        8
    Gandum  
    OP
       2015-05-18 18:34:24 +08:00
    @caomu 完美解决方案,多谢!
    yeyeye
        9
    yeyeye  
       2015-05-18 23:59:21 +08:00
    @Gandum http://pipes.yahoo.com/pipes/pipe.info?_id=0266e168710054b6c147ce7ae1d556be

    无RSS列表网页,生成RSS并抓取全文。

    虽然被抓的网页已经不可用,但是你克隆过去很容易就理解如何做全套了。

    这个好处就在于不用再依赖其他第三方了。
    Gandum
        10
    Gandum  
    OP
       2015-05-19 21:16:38 +08:00 via iPad
    @yeyeye 多谢,我试了一下,不过貌似Yahoo抓取次数过于频繁,许多Feed43能够正常生成RSS的网站直接Ban了Yahoo,返回403
    yeyeye
        11
    yeyeye  
       2015-05-19 23:59:00 +08:00
    @Gandum 是我我也ban掉,你是不知道看着那服务器日志 一秒钟都不间隔直接读取几十个我的页面 (获取每个item网址的全文的时候) 不全文的话频率还好的 会缓存一定时间
    Gandum
        12
    Gandum  
    OP
       2015-05-20 16:32:57 +08:00
    @yeyeye 主要还是Yahoo在国内没人用,要是出个Baidu Pipes,看谁敢ban了(不过Baidu会出这样的产品吗)
    yeyeye
        13
    yeyeye  
       2015-05-20 17:26:18 +08:00
    @Gandum 这类不花钱的服务,盈利是个问题,比如IFTTT……你说能靠啥赚钱,规则设置好就再也不去了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1002 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:27 · PVG 06:27 · LAX 14:27 · JFK 17:27
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.