1、引入正则和采集库:import re //正则模块import urllib //urllib模块提供了读取web页面数据的接口
2、先根据url 获取,对应的页面数据:定义函数getHtml().def getHtml(url): page = urllib.urlopen(url) //打开链接 html = page.read() //读取页面数据 return html
3、然后各根据获取图片路径的需求设定正则表达式:定义函数getImg(html).代码如图:
4、运行测试
1、引入正则和采集库:import re //正则模块import urllib //urllib模块提供了读取web页面数据的接口
2、先根据url 获取,对应的页面数据:定义函数getHtml().def getHtml(url): page = urllib.urlopen(url) //打开链接 html = page.read() //读取页面数据 return html
3、然后各根据获取图片路径的需求设定正则表达式:定义函数getImg(html).代码如图:
4、运行测试