小伙伴们大家好呀~
今天我复盘一下昨晚优化脚本的全过程
之前跟大家提过,我一直在尝试把财报下载脚本做兼容优化,让它能在单位的Win7老系统上正常运行。上一回折腾到半夜,脑子已经转不动了,遇到报错完全没法冷静处理,只能先停下来。
休息了一天,状态回满,昨晚重新上阵再试一次。
这次我着重把之前反复下载失败的依赖库找出来,主要是:pandas、akshare、request这几个。
这次我换了个思路:不在pycharm或者anaconda里输入命令让它下载安装了(之前不管是官方源还是国内镜像,总是在这里报错),准备直接自己手动下载对应版本安装包,然后再用命令本地安装。
整体思路确定下来之后,我就让大模型帮我确认,Win7+Python3.8环境下,应该下载哪个版本的依赖库最稳定。
首先处理的是pandas
我直接点击豆包给的链接就进入界面了
虽然下载时间稍微长了点,不过好在确实下载成功了,没再报出莫名其妙的错误。
然后我又让豆包把其它需要的依赖的链接都给我
也都成功下载好了
我把所有下载好的.whl文件统一放到桌面,再在Anaconda里运行安装命令,把这些包逐一本地安装。命令也是让豆包直接生成好,我复制粘贴就能用。
不得不说,豆包在情绪价值这一块确实很到位。
就是真正到了卡壳、解决不了关键问题的时候,它只给安慰不给方案,还是挺让人头疼的,像一个态度很好但给不出标准答案的客服。
到这里一切都很顺利,就在我以为这次终于能把困扰我很久的难题解决了的时候,意外出现了。
我按照豆包给的链接下载akshare
我死活找不到豆包推荐的版本。它给我推荐的是1.12.44版本,但我在官网上能找到的最早版本也是1.16.72的
然后问题解决到这就卡住了
如果强行安装1.16.72版本的,很大概率会触发版本检查,把其他依赖库一并更新,最终又回到“不兼容Python3.8”的老报错上,等于白忙活。
后来我按豆包给出的替代方案尝试:不装akshare,只用pandas+requests直接从新浪财经页面抓取财报数据。但这意味着要对现有代码大幅改写。
我也确实让豆包、智谱、千问都试着写过这段代码,结果都不理想。新浪的反爬策略比较严格,而且我要抓取的页面是动态加载的——就算我手动打开网页,也要点三次才能进到目标数据页,直接输网址都跳不过去。单纯靠大模型生成代码,暂时还搞不定这种场景。
所以这一轮优化尝试,再一次宣告失败。
折腾这么久我也想明白了,强行做逆版本兼容,成本确实太高。想要彻底绕开 akshare,我还得再补一补爬虫相关的知识,以我现在的水平,确实扛不住这么复杂的改写。
慢慢来,不着急,一步一步提升就好。
以前总觉得,遇到难题就必须死磕到底,不然就是 “认输”。
现在才明白:
真正的成长,是敢钻研,也懂止损。
这次的尝试让我看清:
遇到问题,我们要有一头扎进去的勇气;
但也要有及时转身的清醒。
与其把所有精力耗在短期内无法突破的瓶颈上,不如放下执念,把力气投入到下一次更有把握的尝试里。
毕竟,我们的目标从来不是赢过一个问题,而是一直在往前走。