《我用Python爬了1000条暑假工招聘帖,发现大家都在批量生产NPC》
很多人问我,怎么证明“读书有用论”?怎么反驳那些晒工资条的厂哥厂妹?我不想吵,昨晚我写了个爬虫脚本,花半小时把某直聘、某 Boss 上的本地“暑假工”岗位扒了下来,清洗掉中介和骗子,剩下1024条有效数据。
1. 技能需求分布(触目惊心)
这就是大部分18岁年轻人正在争抢的岗位。系统根本不在乎你是谁,不在乎你会不会写代码,不在乎你读过《红楼梦》。系统只需要一个变量,名叫 Labor (劳动力)。你的名字叫张三还是李四,对流水线来说没有任何区别。2. 薪资分布(一眼到头的未来)
做个简单的数学题:一天干12小时,赚180块。一个月不休,5400块。而且,这3000块买断的不是你的时间,而是你大脑的可塑性。当你习惯了这种不需要动脑的重复劳动,你的大脑皮层就会像久不更新的软件一样,逐渐萎缩。3. 岗位描述里的“系统话术”
我做了一个词云分析,最大的几个词除了上面提到的,还有一个高频词:“体验生活”。让一个18岁的年轻人,去流水线上重复两个月机械动作,美其名曰“体验生活”。真正的体验生活,应该是去山区支教,去科技公司实习,去不同的城市流浪。而这种纯粹的体力消耗,只有一个准确的术语:“脑力截肢”。我写这个爬虫,不是为了嘲笑那些去打工的同学,而是为了看清系统的真相。因为读书教会了我写代码,教会了我数据分析,教会了我如何在一堆垃圾信息中提取逻辑。那个在厂里晒工资条的同学,他看到的是“8000块”;我看到的是“8000块买断了你整个夏天的认知升级机会”。我不想做一个只会执行 print("Hello World") 的NPC。如果你还在迷茫,不如试着学一点最基础的Python。不是为了当程序员,而是为了拥有透视数据的能力。当你能看懂这些招聘信息背后的算法逻辑时,你就已经比那些只会拧螺丝的人,高出了一个段位。>>> print(code_for_today)今日彩蛋: 后台回复关键词“反叛”,获取我昨晚跑数据的Jupyter Notebook源码。(别指望我手把手教,自己配置环境去。想当开发者,第一步就是学会读文档。)