破解网页的密秘,python中bf4中的select方法.
前面文章写了,在BeautifulSoup中如何用soup.text soup.string soup.find soup.find_all来处理文字。
可是有时候我们还要得到别的东西,比如内部id等。需要用get到的东西来处理JS的内容。
这时候select就用上了
假如有一段文字如下

部分内容是用soup.text,从下面获取的源码分割。

我们用selct来get 其中的data-key的值

列表化它

对应的text

再通过列表处理,就可用dict(zip(list1,list2))来做一个映射。如何实现这个,我前面的关于字典文章,有细节。
余下的时间,通过url,json拼接,就可以放飞自我了。