这个python库可以抓取复杂网页数据
最近在github看到一个python库能自动处理反爬机制,抓取复杂数据,叫做bright data sdk,是亮数据开发的一个python库。
看github介绍它能调用 bright data的抓取和搜索工具,主要可以绕过机器人检测或验证码,并在几秒钟内从任何网站提取数据。
这就非常强悍的技术了,以前写python爬虫还得自己写算法和配置ip来处理检测,现在这个库直接搞定。
我测试了下确实可以比较稳定的采集数据,后面再去摸索摸索,下面链接注册似乎可以获得免费体验额度,完全够用了。
https://get.brightdata.com/webscra