Python 爬虫-零基础入门 !10分钟搭建你的第一个爬虫
一、爬虫是什么?
如果把互联网比作一张巨大的蛛网,数据就是蛛网各个节点上的猎物,而爬虫就像一只小蜘蛛,顺着网络路径抓取所需的数据。
爬虫简单来说,就是向网站发送请求,获取对应资源后,解析并提取有效信息的程序。
从技术角度讲,就是通过代码模拟浏览器访问网页的行为,将网站返回的HTML代码、JSON数据或图片、视频等文件抓取到本地,再从中筛选出有用信息,保存下来供后续使用。
二、爬虫的基础流程。
1.爬虫基本概念
2.准备工作
3.最简单的爬虫示例
4.完整爬虫步骤详解
5.处理常见问题