有没有一种爬虫服务，只需要我指定网站和规则，就可以定时爬数据，并且可以提供我指定格式的 json api 的

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 2975 天前的主题，其中的信息可能已经有所发展或是发生改变。

如题，希望各路大佬知道，告知一下。

PS：本人比较喜欢看自然科学相关的文章，经常看环球科学的网站，加上我是做 iOS 开发的，所以我想用 swift 做一个 app 方便看文章。

本来是想自己做全栈的，包括设计和前后端(前后端全用 swift)，但是由于我对爬虫方面的知识不太了解，我想先完成 app，后期再用 Perfect 自己学习写爬虫程序。所以要是有现成的爬虫并且是开源的就最好了。

爬虫

Swift

全栈

App

46 条回复 2018-12-15 15:04:50 +08:00

loading

2018 年 3 月 3 日 via iPhone

幽灵蛛

malagebidi

2018 年 3 月 3 日

用 huginn+feedly，完全满足需求。

devjoe

2018 年 3 月 3 日 via iPhone

直接加载整个网页，然后利用 XPath 解析就行

bogun

2018 年 3 月 3 日 via Android

可以试一下 portia，可视化爬虫

likuku

2018 年 3 月 3 日

IFTTT ？

chroming

2018 年 3 月 3 日 via Android

可以看下 pyspider

4BVL25L90W260T9U

2018 年 3 月 3 日 via Android

那你就先 mock 一个数据开发呗，做完再说。说不定中途就放弃了

lScarlet

2018 年 3 月 3 日 via Android

马克

brotherlegend

2018 年 3 月 3 日 via Android

看大佬们回答

yuanfnadi

2018 年 3 月 3 日 via iPhone

toapi
可以把网站变成 api

silencefent

2018 年 3 月 3 日

神箭手

giuem

2018 年 3 月 3 日 via iPhone

https://wrapapi.com/

safedogcc

2018 年 3 月 3 日

这不就是我的 APP [下一栈]( https://nextstack.xyz)
该做的事吗！

原理也是一样，把网站的 html 或者 rss 或者 json api 转换成固定的 json 数据格式，只不过不用爬虫，直接在客户端进行爬取解析，欢迎体验！

sparkssssssss

2018 年 3 月 3 日 via iPhone

马克

zhtttyecho

2018 年 3 月 3 日

马克

zhesheng

2018 年 3 月 3 日 via Android

马克

anonnymous

2018 年 3 月 3 日

克马

Esora

2018 年 3 月 3 日

mark

leriou

2018 年 3 月 3 日

八爪鱼试试

sohoer

2018 年 3 月 3 日

可以先试用下 hicrawler.com ，目前支持 json api 或发布到 wordpress

just1

2018 年 3 月 3 日 via Android

@safedogcc 在安卓版好像只看到了 rss 和知乎专栏

golmic

2018 年 3 月 3 日 via Android

我可以免费提供数据方面的技术支持。微信 lujqme，可以联系我

limbo0

2018 年 3 月 3 日 via iPhone

不趁现在学习一波 python 吗

rootit

2018 年 3 月 3 日

你想的太简单了。。。

safedogcc

2018 年 3 月 4 日

@just1 #21
这类是固定的解析模版，比如 v1.4 的简书专题（近日发布），v1.5 的 hexo 博客支持（待发布）以及后续的 wordpress 博客站点等等一些较常用的 cms 系统（因为基本 dom 元素一致，所以解析代码通用）。

当然，你有兴趣可以看看开发文档，你会发现绝大部分的网站都可以进行创作哒！