书上介绍动态网页获取可以用2种方法:
chrome审查元素定位后找到真实的网址,做为小白,没有指导,实在是不会找
Selenium库模拟浏览器抓取,先尝试这个
需要先安装库,在cmd输入命令pip install selenium,如图1,最后一行显示Successfully installed
我用chrome浏览器,在摸索中实现了Selenium抓取作者(唐松的Python网络爬虫 从入门到实践)用来练习的网站,可能是时间间隔太久,得到的数据跟作者的有些出入,好在是实现了
照本宣科的能做,自己的目标网站真不会了。。。而且很复杂,涉及二级网页,获取数据后还要生成word文档
好在因为其它事又开始了xx上网,于是求助c*h*a*t*g*p*t,用免费版的:上传附件受限、对话次数受限,好在它给力,之前一直卡第一步访问上,直到今天2026.2.26 少少的代码帮忙我实现了所有,那一刻很激动、兴奋,再次感叹科技改变生活,AI编程前景不可估量
跟它互动我经历了:
访问成功
触发反爬
更换网络
绕不开cookie
不知道元素是否合适
在经历过n轮对话和失败后,我决定提供更多图片并结合前期失败的场景优化提示词(需求),结果它就成功了,成功的那一刻,由衷的想对它说你真棒!
做为初学者且是编程小白,要自己独立写出这样的代码,我觉得很难且短期内实现不了,但有了AI编程就不一样了,现在我的目标网站已实现,生成的文档格式还有瑕疵,今天的额度已用完,明天我再试下,希望能再次惊艳我
之前跟豆*包也做了很多次互动,连第一步都没有成,可见差距还是有的
后面的自学,会和日常工作结合和分享,做为小白讲不出大道理,但用AI编程,该知道和了解的知识还是要具备的,所以学习不能停