
想通过淘宝商品图构建一个数据集,直接用 selenium 爬会被封 ip 吗?大家有啥好办法吗?
     1   xieqiqiang00      2023-06-19 11:34:32 +08:00  不可能的,别想了   |  
     2   shawnleo   OP 我看有说用淘宝客 api 的?   |  
     3   asmoker      2023-06-19 13:26:22 +08:00  建议咨询梁博    |  
     4   lhbc      2023-06-19 13:39:09 +08:00 via Android   这两个地址有不少高人,经验丰富,可以去找他们问一下  深圳市坪山区石井街道金田路 200 号 杭州市余杭区临平镇丘山大街 3 号  |  
     6   lithiumii      2023-06-19 14:07:28 +08:00 via Android  啥数量级?几百上千 selenium 没啥问题,拿自己真的在用的帐号登录都行   |  
     7   zictos      2023-06-19 14:13:57 +08:00  淘宝联盟 api 应该可以,只要开通了推广的商家应该都可以   |  
     8   bruce0      2023-06-19 14:16:41 +08:00  就淘宝那反扒, 基本别想了   |  
     9   caesar      2023-06-19 14:20:04 +08:00  现成的电商插件 都有啊 为啥还要自己开发   |  
     10   vus520      2023-06-19 14:24:35 +08:00  如果只是做数据集,不用大面积更新的话,难度不大。解决阿爸的律师团队就行。   |  
     11   Sh4ww      2023-06-19 16:46:16 +08:00  只是采集图片的话,其实淘宝有很多无风控的接口,可以找找看   |  
     12   opengps      2023-06-19 16:51:18 +08:00  电商起家的反扒能力可是第一,你要跟第一较劲,可是个相当难得事情了   |  
     13   LandCruiser      2023-06-19 17:11:24 +08:00  @asmoker 梁博就是爬阿里被告的呀   |  
     14   shawnleo   OP 是否可以通过淘宝客 api 或者淘宝开放平台获取呢?除了淘宝,其他的像小红书或者亚马逊之类的有可行性吗?   |  
     15   streamrx      2023-06-19 20:06:40 +08:00 via iPhone  别想了   |  
     16   tw93      2023-06-19 21:05:08 +08:00  面向监狱编程?   |  
     17   akira      2023-06-19 22:22:42 +08:00  直接买别人采集好的   |  
     18   MoozLee      2023-06-20 08:57:11 +08:00  可以的,前提有可用 ip 池。  按照我们的经验跑列表接口的话,封控严的时候换一个店铺出一次滑块。用详情接口的话,基本可以不用考虑,10 几次出一个滑块吧。 如果用 rpa 的话,你得有 n 多账号,封控不严,就算出滑块也可以自动划过去。 最后,希望你们公司有牛逼的法务  |  
     19   PVXLL      2023-06-20 09:20:04 +08:00 via iPhone  可能会吃牢饭   |  
     20   tLbf2p3UC4BM3H1N      2023-06-20 10:12:05 +08:00  吊淘宝正常访问都给你弹验证,你还用脚本去爬他?真送人头啊?   |  
     21   imnpc      2023-06-20 11:21:37 +08:00  花钱买 API ,有专门的正规的 API ,不要自己尝试采集,正常访问刷新 3 次就有可能让你滑动解锁   |  
     22   lmw2616      2023-06-20 11:43:38 +08:00  好单库的开放 api 里面有,几年前用过,不知道现在还能用不,你去看看   |  
     24   godleon      2023-06-20 17:24:09 +08:00  如果你的爬虫还建立在用 webdriver selenium 这种爬虫层面,就先别搞阿里了。  需要先熟悉别人的反爬规则,然后绕开风控。才能实现你所说的功能  |