Jolly Learning & Phonics.com 资源离线保存攻略
两个顶级自然拼读网站,资源丰富但在线浏览总卡顿?怕哪天打不开?本文教你用AI写一个Python脚本,把整个网站可下载的PDF按分类一键保存到本地。
01 两个网站,够鸡娃很久了
带孩子学自然拼读,我一直在用这两个网站:
🔗 Jolly Learning — jollylearning.com
Jolly Phonics官方出品,内容非常系统。有配套的练习册PDF、闪卡、歌曲歌词、家长指导手册,按照"42个音"的体系分步教学。
🔗 Phonics.com — www.phonics.com
一个老牌自然拼读学习网站,按年级和阶段划分,每个发音都有对应的PDF练习页,适合打印出来给孩子做。
平时在线看看没问题,但说实话——万一哪天网站改版、资源下架、或者网络抽风,就没了。而且每次要用都要打开网页翻半天,不如一次性下载到本地,想打印就打印,想复习就复习。
但问题来了:这两个网站的资源分布在不同分类下,一个一个手动点开下载,几十上百个PDF,手都得点断。
所以我让AI帮我写了个Python脚本——自动爬取、按分类保存、断点续传、失败重试,一条龙搞定。
02 我是怎么让AI干活的
我用的是OpenCode,一个AI编程助手。我只发了一段话给它:
帮我写一个Python脚本,把这个网页里所有可以下载的PDF文件都下载下来:https://jollylearning.com/
要求:
1. 自动识别页面里所有PDF链接
2. 下载到E:\jolly learning这个文件夹里,且一定要根据网页的分类帮我直接分类好
3. 跳过已经下载过的文件,避免重复
4. 下载失败时自动重试2次
然后AI就开始"拼命干活"了——
- 它先 联网搜索 Jolly Learning的网站结构,搞清楚PDF藏在哪些页面下
- 然后 编写Python脚本,用 requests + BeautifulSoup 解析页面
- 自动 按分类创建文件夹,比如 "Resource Bank/Worksheets"、"Audio/Songs"
整个过程我完全不用管,只用看它在终端里刷刷刷地跑进度条。它还会给我一个汇总——哪些下载成功了、哪些失败了、文件保存在哪里。
同样的方式,我又把 Phonics.com 也走了一遍:
帮我写一个Python脚本,把这个网页里所有可以下载的PDF文件都下载下来:www.phonics.com
要求同上:分类保存、跳过已下载、失败重试2次
两条命令,两个网站,全部离线到手。
AI实际生成的脚本要复杂得多——它会先分析网站的导航结构、找到分类页面的入口、递归遍历子页面、处理相对路径和绝对路径、进行文件名校验等等。但这些复杂活,统统交给AI就好。
03 最终成果
两个网站下载完后,我的文件夹结构是这样的:
📁 E:\jolly learning\
├─ Resource Bank\
│ ├─ Worksheets\
│ ├─ Flashcards\
│ └─ Activity Sheets\
├─ Audio\
│ ├─ Songs\
│ └─ Sound Pronunciations\
└─ Parent Guides\
📁 E:\phonics.com\
├─ Kindergarten\
├─ Grade 1\
└─ Grade 2\
PDF全部按分类归好,想找什么直接打开对应的文件夹就行。以后给孩子打印练习册、做闪卡、听歌曲音频——全部离线,随时可用。
04 如果你想自己试试
其实整个过程的核心不是Python,而是敢把需求扔给AI。
很多人看到"写脚本"三个字就退缩了,觉得那是程序员的事。但实际上,现在用AI编程助手,你只需要说清楚你要什么:
把这些说清楚,AI就能帮你把脚本写出来、跑起来、甚至自动修复报错。你要做的就是在旁边看着它干活。
💡 小建议:如果你也想下载这类教育资源网站,建议先观察网站结构:PDF链接是在当前页面直接列出,还是隐藏在分类导航下?AI会帮你处理,但你的需求说得越清楚,AI干活越精准。
写在最后
Jolly Learning 和 Phonics.com 的内容质量很高,Jolly Phonics 的系统性尤其值得称道——42个发音一步步来,配套资源丰富到超乎想象。把这些资源离线下载下来,不管是自己备课、给孩子做练习,还是带到没有网络的地方用,都非常方便。
如果你手里还有其他好用的自然拼读网站,也可以试试同样的方法——需求说清楚,AI帮你干活,你只管收成果。