本周是加入研究组的第30周,这周接着上周的任务,把CHFS的数据进行合并清洗,并且把pycharm虚拟环境安装完毕。
首先是CHFS数据各年份的纵向合并,我在网上还没有找到相关教程,但已经合并好2011、2013和2015年的数据,接下来我会进行纵向的合并。
由于最开始寻找数据时就出了一点问题,所以现在想说一下当时遇到的问题。首先是,在CHFS官网下载原始数据时,要下载最新更新的版本,因为旧版可能不兼容现在新版本的stata,导致你的数据库一打开里面的变量等都是乱码,这也是我遇到的一个问题,我一度怀疑是我电脑出了问题,还去找了线下店修电脑。然后是对变量的认识,如果你明确自己需要哪些变量,需要把哪些变量剔除掉,这样你的工作量就会减少不少。最后是要对变量进行1:1的对应,对应之后也要验证一下是否对应成功。
在python的学习方面,我在网络上搜索到教程并安装了pycharm,并且在朋友的帮助下配置了虚拟环境,之后我试着用一些代码进行执行,结果也是成功的。接下来我会去学习经济学相关的python代码,把python和经济学联系起来,帮助自己的科研工作。
2025.10.21
文字:邰俊景 | 排版:范苗苗 | 审核:戚盈