GoogleReader备份的xml文件怎么阅读？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 4576 天前的主题，其中的信息可能已经有所发展或是发生改变。

大神写了python程序（http://live.aulddays.com/tech/13/google-reader-archive-download.htm）可以直接导出各个item的所有记录，均为xml文件。很多网站的一辈子都记录在这个小小的xml文件里了。

但是本人小白，压根不知道怎么用这东西，有什么软件能把xml还原成阅读模式吗？

xml

Python

GoogleReader

22 条回复 1970-01-01 08:00:00 +08:00

wswj

2013-06-21 12:35:36 +08:00

已经把十多个item保存了，1.2G，急求使用方法教学

Jessepinkman

2013-06-21 12:44:41 +08:00

极客公园提供Google Reader Archive Project,可以将用户从 Google Reader 导出的数据转换为便于查看的 HTML 网页，包含简单的交互功能，同时尽量保留大家熟悉的 Google Reader 页面风格。
URL: http://www.geekpark.net/lab/google_reader

loading

2013-06-21 12:50:23 +08:00 via iPhone

上次feedly清掉我的feed怎么算，屮

wswj

2013-06-21 14:19:09 +08:00

@Jessepinkman
不一样的。gr只能导出自己的共享星标条目。

这个是能够把各个feed的所有条目全部导出来，有用多了！（相当于把整个网站离线保存了）
很多网站已经关闭，但是只要有rss，gr都给保存了。谷歌选择把它关闭真是太可惜了

regent

2013-06-21 14:43:40 +08:00

@Jessepinkman 这个只能对Google takeout导出的文件进行处理，而@wswj 说的这个可以抓取历史数据。希望v2ex上的各位能够开发一个针对性的xml 转html工具，然后就能够通过本地检索了。

@zythum @clowwindy @jybox @detecti1914 @alexrezit @rankjie @hit9 @sliuqin
哪位有空有兴趣做一做？这个造福广大群众啊

alexrezit

2013-06-21 16:02:35 +08:00

@regent
为啥 @ 我... = =

rankjie

2013-06-21 16:11:28 +08:00

@regent
怎么被@了＝＝
我好像用了feedly，之前的archive都在里面了，所以好像没有必要吧...

wswj

2013-06-21 16:33:18 +08:00 via Android

@regent
感谢！我正指望着大神开发阅读器。
其实最主要的是提醒下大家，有需要保存的东西赶紧去下载，只有10天不到了。

regent

2013-06-21 19:05:27 +08:00

@alexrezit
@rankjie 感觉二位动手能力强啊

另外，feedly有feed的历史存档？确定吗？
这个程序可以把Google reader开始抓取后的全部历史存档获取到，如果能够转换为更方便检索和查看的html的话，就更方便了。

alexrezit

2013-06-21 19:14:03 +08:00

@regent
我啥都不会... = =

LamProductionS

2013-06-21 19:16:41 +08:00 via iPhone

geekpark有提供相应的工具

ouankou

2013-06-21 19:20:45 +08:00

@LamProductionS geekpark只是针对官方导出的星标和共享文章吧，不支持自己单独导出的完整RSS记录。

laoyang945

2013-06-21 19:21:03 +08:00

@regent 其实我原来写过把这样导出的文章转换为wordpress的xml格式的脚本……

swulling

2013-06-21 19:29:08 +08:00

用随便什么RSS阅读器打开就行

regent

2013-06-21 19:53:22 +08:00

@ouankou 的确如此

@laoyang945 那就更好了，熟能生巧，造福群众，来一个转换html的脚本吧，要不你留个邮箱，我传送一份我下载的xml 给你看看？或者你可以用
http://live.aulddays.com/tech/13/google-reader-archive-download.htm 对应下载
https://github.com/Aulddays/GReader-Archive/archive/master.zip
解包后输入GR用户名密码即可开始备份，一般1分钟左右就能获取到第一个备份包

@LamProductionS 它们的有限制的，还不如直接用这个http://www.appinn.com/convertjson/ 本地转换，极客公园那个隐私政策不明，说”数据仅用于本项目用途“，懒得用

wswj

2013-06-21 20:09:23 +08:00 via Android

那啥，我把1024的下载了。
之前在性感玉米微博里看到过，发现能下载后赶紧拿马甲订阅了。。

wswj

2013-06-21 22:36:02 +08:00

继续求

manoon

2013-06-21 22:55:43 +08:00

我好像最近正在折腾python跟xml的东西。
如果可能的话，下周开始顺便把这个折腾一下。
思路如下:
A,python+bs 解析xml
B,入库 mysql或者sqllite
C,pyqt 数据库里面取东西出来，然后界面美化一下。

这是不是就可以了？

lzyland

2013-06-25 01:51:52 +08:00

https://pbs.twimg.com/media/BNhUkHMCIAATZan.jpg
GReader-Archive导出中断，哪位看下什么原因？对python不了解

wswj

2013-06-25 16:40:26 +08:00 via Android

@lzyland
手机没fq，看不到图。
上次见有人提过feed的名字有问题，比如空白名字或者奇怪的字符之类的。
还有就作者说的ip会暂时屏蔽，但我用ipv6下了一天都没遇到过

lzyland

2013-06-26 00:44:39 +08:00

@wswj https://github.com/Aulddays/GReader-Archive/issues/1 和这个问题的第一点一样，但是不了解是怎么回事怎么解决的

wswj

2013-06-26 02:07:12 +08:00

@lzyland 直接删了那条feed得了..最后几天不指望程序修正