自学3 我打通了访问,获取了整个页面的HTML代码,然后需要用BeatifulSoup对页面进行解析,解析前我需要知道哪些元素是我要提取的,这些元素在HTML代码中的位置
步骤1
使用Chrome浏览器打开目标网站。右击网页页面,在弹出的快捷菜单中单击“检查”命令,如图1
步骤2
在网页右侧出现审查元素页面。单击左上角的鼠标键按钮(图2红圈圈起来的图标),然后在目标网页页面上单击想要的数据,下面的Elements会出现相应的code所在的地方,就定位到想要的元素了。
这一步建议去实操下,涉及敏感信息我就不放图展示了
定位的时候发现在获取的HTML里找不到检查定位的元素
又开始各种研究,我的目标网站是动态网页。。。
如果是静态网页,用我上一节的request方式获取的HTML内容与Chrome的审查元素看到的HTML,要几乎一致
因为我的目标网站是动态的,所以不一致,我用审查元素定位到的内容用soup找不到,哈哈哈哈
路漫漫其修远兮,吾将上下而求索!!!!
#Python爬虫入门教程#HTML元素定位技巧#BeautifulSoup解析方法#技术小白成长记#Chrome开发者工具实战