V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
wswj
V2EX  ›  问与答

GoogleReader备份的xml文件怎么阅读?

  •  
  •   wswj · 2013-06-20 23:00:08 +08:00 · 4274 次点击
    这是一个创建于 4177 天前的主题,其中的信息可能已经有所发展或是发生改变。
    大神写了python程序(http://live.aulddays.com/tech/13/google-reader-archive-download.htm)可以直接导出各个item的所有记录,均为xml文件。很多网站的一辈子都记录在这个小小的xml文件里了。

    但是本人小白,压根不知道怎么用这东西,有什么软件能把xml还原成阅读模式吗?
    22 条回复    1970-01-01 08:00:00 +08:00
    wswj
        1
    wswj  
    OP
       2013-06-21 12:35:36 +08:00
    已经把十多个item保存了,1.2G,急求使用方法教学
    Jessepinkman
        2
    Jessepinkman  
       2013-06-21 12:44:41 +08:00
    极客公园提供Google Reader Archive Project,可以将用户从 Google Reader 导出的数据转换为便于查看的 HTML 网页,包含简单的交互功能,同时尽量保留大家熟悉的 Google Reader 页面风格。
    URL: http://www.geekpark.net/lab/google_reader
    loading
        3
    loading  
       2013-06-21 12:50:23 +08:00 via iPhone
    上次feedly清掉我的feed怎么算,屮
    wswj
        4
    wswj  
    OP
       2013-06-21 14:19:09 +08:00
    @Jessepinkman
    不一样的。gr只能导出自己的共享星标条目。

    这个是能够把各个feed的所有条目全部导出来,有用多了!(相当于把整个网站离线保存了)
    很多网站已经关闭,但是只要有rss,gr都给保存了。谷歌选择把它关闭真是太可惜了
    regent
        5
    regent  
       2013-06-21 14:43:40 +08:00
    @Jessepinkman 这个只能对Google takeout导出的文件进行处理,而@wswj 说的这个可以抓取历史数据。希望v2ex上的各位能够开发一个针对性的xml 转html工具,然后就能够通过本地检索了。

    @zythum @clowwindy @jybox @detecti1914 @alexrezit @rankjie @hit9 @sliuqin
    哪位有空有兴趣做一做?这个造福广大群众啊
    alexrezit
        6
    alexrezit  
       2013-06-21 16:02:35 +08:00
    @regent
    为啥 @ 我... = =
    rankjie
        7
    rankjie  
       2013-06-21 16:11:28 +08:00
    @regent
    怎么被@了= =
    我好像用了feedly,之前的archive都在里面了,所以好像没有必要吧...
    wswj
        8
    wswj  
    OP
       2013-06-21 16:33:18 +08:00 via Android
    @regent
    感谢!我正指望着大神开发阅读器。
    其实最主要的是提醒下大家,有需要保存的东西赶紧去下载,只有10天不到了。
    regent
        9
    regent  
       2013-06-21 19:05:27 +08:00
    @alexrezit
    @rankjie 感觉二位动手能力强啊

    另外,feedly有feed的历史存档?确定吗?
    这个程序可以把Google reader开始抓取后的全部历史存档获取到,如果能够转换为更方便检索和查看的html的话,就更方便了。
    alexrezit
        10
    alexrezit  
       2013-06-21 19:14:03 +08:00
    @regent
    我啥都不会... = =
    LamProductionS
        11
    LamProductionS  
       2013-06-21 19:16:41 +08:00 via iPhone
    geekpark有提供相应的工具
    ouankou
        12
    ouankou  
       2013-06-21 19:20:45 +08:00
    @LamProductionS geekpark只是针对官方导出的星标和共享文章吧,不支持自己单独导出的完整RSS记录。
    laoyang945
        13
    laoyang945  
       2013-06-21 19:21:03 +08:00
    @regent 其实我原来写过把这样导出的文章转换为wordpress的xml格式的脚本……
    swulling
        14
    swulling  
       2013-06-21 19:29:08 +08:00
    用随便什么RSS阅读器打开就行
    regent
        15
    regent  
       2013-06-21 19:53:22 +08:00   ❤️ 1
    @ouankou 的确如此

    @laoyang945 那就更好了,熟能生巧,造福群众,来一个转换html的脚本吧,要不你留个邮箱,我传送一份我下载的xml 给你看看?或者你可以用
    http://live.aulddays.com/tech/13/google-reader-archive-download.htm 对应下载
    https://github.com/Aulddays/GReader-Archive/archive/master.zip
    解包后输入GR用户名密码即可开始备份,一般1分钟左右就能获取到第一个备份包

    @LamProductionS 它们的有限制的,还不如直接用这个http://www.appinn.com/convertjson/ 本地转换,极客公园那个隐私政策不明,说”数据仅用于本项目用途“,懒得用
    wswj
        16
    wswj  
    OP
       2013-06-21 20:09:23 +08:00 via Android
    那啥,我把1024的下载了。
    之前在性感玉米微博里看到过,发现能下载后赶紧拿马甲订阅了。。
    wswj
        17
    wswj  
    OP
       2013-06-21 22:36:02 +08:00
    继续求
    manoon
        18
    manoon  
       2013-06-21 22:55:43 +08:00   ❤️ 1
    我好像最近正在折腾python跟xml的东西。
    如果可能的话,下周开始顺便把这个折腾一下。
    思路如下:
    A,python+bs 解析xml
    B,入库 mysql或者sqllite
    C,pyqt 数据库里面取东西出来,然后界面美化一下。

    这是不是就可以了?
    lzyland
        19
    lzyland  
       2013-06-25 01:51:52 +08:00
    https://pbs.twimg.com/media/BNhUkHMCIAATZan.jpg
    GReader-Archive导出中断,哪位看下什么原因?对python不了解
    wswj
        20
    wswj  
    OP
       2013-06-25 16:40:26 +08:00 via Android   ❤️ 1
    @lzyland
    手机没fq,看不到图。
    上次见有人提过feed的名字有问题,比如空白名字或者奇怪的字符之类的。
    还有就作者说的ip会暂时屏蔽,但我用ipv6下了一天都没遇到过
    lzyland
        21
    lzyland  
       2013-06-26 00:44:39 +08:00
    @wswj https://github.com/Aulddays/GReader-Archive/issues/1 和这个问题的第一点一样,但是不了解是怎么回事怎么解决的
    wswj
        22
    wswj  
    OP
       2013-06-26 02:07:12 +08:00
    @lzyland 直接删了那条feed得了..最后几天不指望程序修正
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   6011 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 02:39 · PVG 10:39 · LAX 18:39 · JFK 21:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.