GoogleReader备份的xml文件怎么阅读? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wswj
V2EX    问与答

GoogleReader备份的xml文件怎么阅读?

  •  
  •   wswj 2013-06-20 23:00:08 +08:00 4792 次点击
    这是一个创建于 4576 天前的主题,其中的信息可能已经有所发展或是发生改变。
    大神写了python程序(http://live.aulddays.com/tech/13/google-reader-archive-download.htm)可以直接导出各个item的所有记录,均为xml文件。很多网站的一辈子都记录在这个小小的xml文件里了。

    但是本人小白,压根不知道怎么用这东西,有什么软件能把xml还原成阅读模式吗?
    22 条回复    1970-01-01 08:00:00 +08:00
    wswj
        1
    wswj  
    OP
       2013-06-21 12:35:36 +08:00
    已经把十多个item保存了,1.2G,急求使用方法教学
    Jessepinkman
        2
    Jessepinkman  
       2013-06-21 12:44:41 +08:00
    极客公园提供Google Reader Archive Project,可以将用户从 Google Reader 导出的数据转换为便于查看的 HTML 网页,包含简单的交互功能,同时尽量保留大家熟悉的 Google Reader 页面风格。
    URL: http://www.geekpark.net/lab/google_reader
    loading
        3
    loading  
       2013-06-21 12:50:23 +08:00 via iPhone
    上次feedly清掉我的feed怎么算,屮
    wswj
        4
    wswj  
    OP
       2013-06-21 14:19:09 +08:00
    @Jessepinkman
    不一样的。gr只能导出自己的共享星标条目。

    这个是能够把各个feed的所有条目全部导出来,有用多了!(相当于把整个网站离线保存了)
    很多网站已经关闭,但是只要有rss,gr都给保存了。谷歌选择把它关闭真是太可惜了
    regent
        5
    regent  
       2013-06-21 14:43:40 +08:00
    @Jessepinkman 这个只能对Google takeout导出的文件进行处理,而@wswj 说的这个可以抓取历史数据。希望v2ex上的各位能够开发一个针对性的xml 转html工具,然后就能够通过本地检索了。

    @zythum @clowwindy @jybox @detecti1914 @alexrezit @rankjie @hit9 @sliuqin
    哪位有空有兴趣做一做?这个造福广大群众啊
    alexrezit
        6
    alexrezit  
       2013-06-21 16:02:35 +08:00
    @regent
    为啥 @ 我... = =
    rankjie
        7
    rankjie  
       2013-06-21 16:11:28 +08:00
    @regent
    怎么被@了= =
    我好像用了feedly,之前的archive都在里面了,所以好像没有必要吧...
    wswj
        8
    wswj  
    OP
       2013-06-21 16:33:18 +08:00 via Android
    @regent
    感谢!我正指望着大神开发阅读器。
    其实最主要的是提醒下大家,有需要保存的东西赶紧去下载,只有10天不到了。
    regent
        9
    regent  
       2013-06-21 19:05:27 +08:00
    @alexrezit
    @rankjie 感觉二位动手能力强啊

    另外,feedly有feed的历史存档?确定吗?
    这个程序可以把Google reader开始抓取后的全部历史存档获取到,如果能够转换为更方便检索和查看的html的话,就更方便了。
    alexrezit
        10
    alexrezit  
       2013-06-21 19:14:03 +08:00
    @regent
    我啥都不会... = =
    LamProductionS
        11
    LamProductionS  
       2013-06-21 19:16:41 +08:00 via iPhone
    geekpark有提供相应的工具
    ouankou
        12
    ouankou  
       2013-06-21 19:20:45 +08:00
    @LamProductionS geekpark只是针对官方导出的星标和共享文章吧,不支持自己单独导出的完整RSS记录。
    laoyang945
        13
    laoyang945  
       2013-06-21 19:21:03 +08:00
    @regent 其实我原来写过把这样导出的文章转换为wordpress的xml格式的脚本……
    swulling
        14
    swulling  
       2013-06-21 19:29:08 +08:00
    用随便什么RSS阅读器打开就行
    regent
        15
    regent  
       2013-06-21 19:53:22 +08:00   1
    @ouankou 的确如此

    @laoyang945 那就更好了,熟能生巧,造福群众,来一个转换html的脚本吧,要不你留个邮箱,我传送一份我下载的xml 给你看看?或者你可以用
    http://live.aulddays.com/tech/13/google-reader-archive-download.htm 对应下载
    https://github.com/Aulddays/GReader-Archive/archive/master.zip
    解包后输入GR用户名密码即可开始备份,一般1分钟左右就能获取到第一个备份包

    @LamProductionS 它们的有限制的,还不如直接用这个http://www.appinn.com/convertjson/ 本地转换,极客公园那个隐私政策不明,说”数据仅用于本项目用途“,懒得用
    wswj
        16
    wswj  
    OP
       2013-06-21 20:09:23 +08:00 via Android
    那啥,我把1024的下载了。
    之前在性感玉米微博里看到过,发现能下载后赶紧拿马甲订阅了。。
    wswj
        17
    wswj  
    OP
       2013-06-21 22:36:02 +08:00
    继续求
    manoon
        18
    manoon  
       2013-06-21 22:55:43 +08:00   1
    我好像最近正在折腾python跟xml的东西。
    如果可能的话,下周开始顺便把这个折腾一下。
    思路如下:
    A,python+bs 解析xml
    B,入库 mysql或者sqllite
    C,pyqt 数据库里面取东西出来,然后界面美化一下。

    这是不是就可以了?
    lzyland
        19
    lzyland  
       2013-06-25 01:51:52 +08:00
    https://pbs.twimg.com/media/BNhUkHMCIAATZan.jpg
    GReader-Archive导出中断,哪位看下什么原因?对python不了解
    wswj
        20
    wswj  
    OP
       2013-06-25 16:40:26 +08:00 via Android   1
    @lzyland
    手机没fq,看不到图。
    上次见有人提过feed的名字有问题,比如空白名字或者奇怪的字符之类的。
    还有就作者说的ip会暂时屏蔽,但我用ipv6下了一天都没遇到过
    lzyland
        21
    lzyland  
       2013-06-26 00:44:39 +08:00
    @wswj https://github.com/Aulddays/GReader-Archive/issues/1 和这个问题的第一点一样,但是不了解是怎么回事怎么解决的
    wswj
        22
    wswj  
    OP
       2013-06-26 02:07:12 +08:00
    @lzyland 直接删了那条feed得了..最后几天不指望程序修正
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1045 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 41ms UTC 18:35 PVG 02:35 LAX 10:35 JFK 13:35
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86