您好,匿名用户

一个Python爬虫字符串相关的错误?

0 投票

用Python爬豆瓣日记,将页面以html格式保存。其中至少20篇日记保存正常,某篇报错。错误信息如下。
是字符编码方式的错误吗,应该如何解决?
该日记名可在终端正常显示。

file_object = open(dir + '/' + article + '.html', 'w')
IOError: [Errno 2] No such file or directory: 'dir/Even artichokes have doubts - \xe4\xb8\x80\xe4\xb8\xaaYALE\xe5\xa5\xb3\xe7\x94\x9f\xe5\xaf\xb9\xe4\xba\x8eIB/Consulting\xe7\x9a\x84\xe8\xb4\xa8\xe7\x96\x91.html'
用户头像 提问 2015年 7月17日 @ Rumble 中士 (1,184 威望)
分享到:

1个回答

0 投票

因为日志标题包含 IB/Consulting 字符串,也就是说有斜杠。而 HFS+ 的文件名是不允许有 /的。

用户头像 回复 2015年 7月17日 @ Virgo 下士 (894 威望)
提一个问题:

相关问题

0 投票
1 回复 146 阅读
0 投票
0 回复 90 阅读
用户头像 提问 2016年 3月19日 @ Leo 中士 (1,025 威望)
0 投票
1 回复 24 阅读
用户头像 提问 2016年 5月30日 @ Olaf 中士 (1,031 威望)
0 投票
1 回复 696 阅读

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...