您好,匿名用户
随意问技术百科期待您的加入

python 解析网页不出来

0 投票

import urllib2
import BeautifulSoup
start_url='http://blog.sina.com.cn/s/blog_4fe231...'
blog_main = urllib2.urlopen(start_url).read()
soup2 = BeautifulSoup(blog_main)
print soup2.h2

获取标题,显示none

用户头像 提问 2014年 1月11日 @ Janna 下士 (667 威望)
分享到:

1个回答

0 投票

如果仅仅是获取title的话,难道不应该这么写么?

import urllib2
import BeautifulSoup
start_url='http://blog.sina.com.cn/s/blog_4fe231ed01019erl.html'
blog_main = urllib2.urlopen(start_url).read()
soup2 = BeautifulSoup.BeautifulSoup(blog_main)
print soup2.html.head.title

我试了一下是可以的,虽然乱码了。

用户头像 回复 2014年 1月5日 @ Leo 上等兵 (255 威望)
提一个问题:

相关问题

0 投票
0 回复 18 阅读
0 投票
1 回复 32 阅读
用户头像 提问 2014年 1月11日 @ Archer 上等兵 (494 威望)
0 投票
1 回复 43 阅读
用户头像 提问 2012年 12月1日 @ Pantheon 上等兵 (388 威望)
0 投票
1 回复 91 阅读
0 投票
1 回复 51 阅读
用户头像 提问 2012年 12月1日 @ Demeter 上等兵 (208 威望)

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...