###我想做一个极简的,只是看电影打卡的小程序,目前程序差不多完成 80%,但是一边写一边自我怀疑,爬取豆瓣的信息到底怎么才不违规?和 V 友们讨论一下:
-
爬取的标题、介绍、片名等都不在 robot 协议限制当中,这个应该是合规的吧?
-
封面、剧照等图片文件的地址被 robot 协议限制,我如果直接用豆瓣地址显示算违规吗?
-
我把豆瓣图片 download 下来,上传到自己的 oss 上面算违规吗?
-
如果违规了,但是我这么小的小程序,会被追究吗?
-
结合 234 ,如果我只爬 robot 协议限制之外的文字信息,图片什么的使用鼠标人工下载图片,再上传到 oss 上(其实这样和爬虫作用一样,但是我在小程序上声明,所有图片都是人工手动保存并上传的,这样违规吗?)
-
IMDB 上也不行,而且限制比豆瓣还多。
最后一点,如果怎么都绕不过去,我只爬取 robots 协议里面开放的文字信息,这个肯定没问题吧???
希望大家批评指正。
