您好,匿名用户
随意问技术百科期待您的加入

写爬虫爬网站内容时遇到ip被封,请问如何使用代理?

0 投票

写爬虫爬网站内容时遇到ip被封,请问如何使用代理?
用了网上搜到的http://www.cnproxy.com/ 代理服务器中的ip和端口,没有一个可以用的。。。
请高手帮忙。小弟多谢

用户头像 提问 2014年 1月11日 @ Cho'Gath 上等兵 (267 威望)
分享到:

1个回答

0 投票
 
最佳答案

考虑一下几点建议:
1.使用VPN,这样就完全保证了你的出口IP地址是VPN服务器端的IP。
2.使用HTTP代理,具体代码可以都可以设置代理方式,不要使用免费代理,不可靠,自己用VPS来搭建或者自己写,我个人就是自己用Node.js写的代理服务器在美国
3.爬虫抓取过程中请遵循robot协议,这是默认的业界标准

用户头像 回复 2014年 1月11日 @ Taurus 上等兵 (303 威望)
选中 2013年 9月7日 @Cho'Gath
提一个问题:

相关问题

0 投票
1 回复 51 阅读
用户头像 提问 2013年 10月10日 @ Kog'Maw 上等兵 (212 威望)
0 投票
1 回复 23 阅读
用户头像 提问 2014年 1月27日 @ Ryze 上等兵 (293 威望)
0 投票
1 回复 91 阅读
0 投票
1 回复 37 阅读
用户头像 提问 2013年 12月29日 @ Kennen 上等兵 (442 威望)

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...