![]() | 1 zhengxiaowai 2018-07-21 19:06:03 +08:00 proxy = 'http://'+rows -> proxy = 'https://'+rows |
![]() | 2 ysc3839 2018-07-21 19:11:55 +08:00 via Android 你想表达什么?“原 IP 列表”指的是什么? |
![]() | 3 sola97 2018-07-21 19:26:53 +08:00 请求百度用的 https,proxies = {"http": proxy} 代理 http,当然不匹配 |
![]() | 4 ysc3839 2018-07-21 19:33:28 +08:00 via Android 你的 proxies 配置也有问题 http://docs.python-requests.org/en/master/user/advanced/#proxies |
![]() | 5 h19981126g OP 我的 ip 的列表有 https 和 http,一般怎么处理好? |
![]() | 6 h19981126g OP @sola97 我的 ip 的列表有 https 和 http,一般怎么处理好? |
![]() | 7 h19981126g OP @ysc3839 proxies 我看过文档是怎么写的,就是问数组里的 ip 怎样变成参考里带引号能用的样子 |
![]() | 8 ysc3839 2018-07-21 19:47:22 +08:00 via Android @h19981126g 你的 csv 是怎样的?发来看看。 |
![]() | 9 also24 2018-07-21 19:48:28 +08:00 @h19981126g #7 你 5 楼的问题,在 4 楼给出的链接里有答案 |
![]() | 10 h19981126g OP @also24 就是看过了还不知道怎么解决 才来问的。 |
11 golmic 2018-07-21 19:52:35 +08:00 via Android @h19981126g 直接 proxy=("all":row) 换成大括号 |
![]() | 12 also24 2018-07-21 19:52:57 +08:00 |
13 golmic 2018-07-21 19:53:04 +08:00 via Android row 加一下 http 或者 https 协议头 |
![]() | 14 h19981126g OP @ysc3839 不用管 csv 是怎么样的,我设置读到 python 里就是个数组,就是解决 requests 代理从数组中读取地址,和 https 的问题 http://i4.bvimg.com/653190/d2ca3f32af5b6288.jpg http://i4.bvimg.com/653190/67387ae897763b8d.jpg |
![]() | 15 ysc3839 2018-07-21 20:01:53 +08:00 via Android @h19981126g 你 csv 里面都没记录代理服务器是 http 还是 https,那没办法处理啊? |
![]() | 16 h19981126g OP 我有办法爬到,只是现在没爬 |
![]() | 17 h19981126g OP @ysc3839 我有办法爬到,只是现在没爬 |
![]() | 18 ysc3839 2018-07-21 20:59:38 +08:00 via Android @h19981126g 那你爬的时候把完整 URL 写进 csv 就好了。 |
![]() | 19 also24 2018-07-21 22:38:40 +08:00 via Android 骑了一圈儿车回来,楼主是还没找到方法嘛? 试试把 proxies = {"http": proxy} 改成 proxies = {"http": proxy, "https":proxy,} 会怎样 |
![]() | 21 h19981126g OP @also24 谢谢,已经找到了,只是没回复,我直接用的 proxies = {"all": proxy} 不知道有没有问题 |