聚合网站,有很多来自与站外的图片链接,我既不想保存,但是又不想有出站链接。
有没有办法将图片全部变成本站链接,但是又不保存图片呢?
代码正则替换呢?还是js层面替换?爬虫会检测到?
求思路,求指点。
有没有办法将图片全部变成本站链接,但是又不保存图片呢?
代码正则替换呢?还是js层面替换?爬虫会检测到?
求思路,求指点。

1 zorceta Jun 19, 2013 example.com/go/{base64encoded} |
2 lichao Jun 19, 2013 爬虫无视 js,1 楼方法可以 |
3 takwai Jun 19, 2013 代码里面替换似乎好一些,不过得加一层代理,替换过的链接经代理读回远程的图片数据再返回给客户端? |
4 cloudzen Jun 19, 2013 这样做的目的是什么呢? |
5 takwai Jun 19, 2013 额,不对,犯傻了,代理不需要。 就如一楼说的那方法,解码得出真实地址后,直接在代码里面来一句 Redirect 到真实地址就好了。 |
6 kaifazhe Jun 19, 2013 图片都转base64,html不是会变的超级臃肿,爬虫更不会喜欢 |
7 orzcc Jun 20, 2013 图片地址加密赋值给img的某一个属性xx(非src),用lazy load的原理将xx值解密,然后赋值给src。 |