![]() | 1 forbe 2014-07-01 00:29:37 +08:00 用 Go吧,http://meijia0.com就是我最近用GO写的一个小爬虫,很简单很方便 |
![]() | 2 11138 2014-07-01 06:07:07 +08:00 ![]() 先判断一下“get”成功了再往下操作。 |
![]() | 3 orzfly 2014-07-01 07:47:32 +08:00 用来爬取某网站 类似如下形式: http://www.zhihu.com |
![]() | 5 11138 2014-07-01 10:44:18 +08:00 my $tx = $ua->get($l->[0]); 这里,由于各种网络原因,“get”的结果可能是失败的,所以你要判断一下啊。 http://search.cpan.org/~sri/Mojolicious-5.10/lib/Mojo/UserAgent.pm if (my $res = $tx->success) { say $res->body } else { my $err = $tx->error; die "$err->{code} response: $err->{message}" if $err->{code}; die "Connection error: $err->{message}"; } |
6 akagi OP @11138 恩,我表述的不大清楚。之前你的回复我看明白了,只是还没搞懂get失败的可能原因。如果单次get可以成功,多条情况可能失败,这里的“各种网络原因”,具体可能有哪些,希望能稍微展开下 :) |
![]() | 7 11138 2014-07-01 11:16:11 +08:00 如果获取失败你可以将错误的信息打印出来看看啊,参考上面的代码。 |