您好,欢迎来到二三四教育网。
搜索
您的当前位置:首页简易爬虫抓取糗事百科热门

简易爬虫抓取糗事百科热门

来源:二三四教育网

我没用正则表达式,用了beautifulsoup

代码比较简易

import urllib2
from bs4 import BeautifulSoup

 url = 

user_agent = 'Mozilla/5.0 (Windows NT 6.1)'

headers = {'User-agent' : user_agent}

request = urllib2.Request(url,headers= headers)

response = urllib2.urlopen(request)

cat_img = response.read().decode('utf-8')

bs0bj = BeautifulSoup(cat_img,"html.parser")

namelist = bs0bj.findAll('div', "content")

for name in namelist:

print(name.string)
QQ截图20160727202440.png

本文如未解决您的问题请添加抖音号:51dongshi(抖音搜索懂视),直接咨询即可。

热门图文

Copyright © 2019-2025 how234.cn 版权所有 赣ICP备2023008801号-2

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务