假如我有一個頁面,我要對其分開,並取出有用的東西。
第一步,把對象soup化,info=soup.select('div')。得到所有的div塊。
我們任找一個

從上到下分割
得到div的a標簽
用.方法
用得到的內容.string 可以得到文本

用find/find_all方法

用find(text)方法提取a標簽文本,註意可用正則表達式

用get方法可以獲取別的元素

用字典方法得到標簽a

用參數方法find_all得到a
註意 參數名是class_。

用參數方法find得到a

用find_all方法提取,此div下面的文本

把上面知識點結合python中的for,就會得到文本如下

得到url如下

本文文本來自公開網頁,如果此文本對此網頁帶來麻煩,請聯係我。將立即del。