本来想在本年第一期就开Python分享,可惜当时研究了一周多Python环境配置,有点麻烦,没搞出来。上周值班串休一天,搁家里研究一天才算明白了。
Python其实笔者很早就有接触,笔者的数据科学启蒙源于本科的微生物生态学,当时的老师提过如何想分析环境数据基础的要学点SPSS进阶一点就要学Matlab,R,Python。那之后就稍微接触学习了一点,想当初笔者还是20年准备考研复试的时候在网上学的Python,依稀记得之前用的是jupyter notebook在网页中进行代码编写,跟着一个挺主流的课程(最后一节课是做飞机大战)不过基本忘光了,只能记得print(“hello world”)(属于是经典Python课程的第一个代码了),再之后读研期间因为接触赖江山老师译作数量生态学-R语言的应用这本书之后就完全学习R语言相关,Python就落下了,所以笔者新开的系列也是以拾遗为主,穿插我们的主流ML/DL的要求,以及它与R语言之间的区别,毕竟它们二者之间各有优劣(尤其是在ML/DL中,R并不是主流语言)因此本系列将从环境配置讲起,逐步过渡到数据处理、可视化及机器学习实践。
首先就是Python的下载,因为Python环境配置的原因,对于我们这些非计算机专业的以及一些初学者来说有些复杂,所以我们选用比较傻瓜式的Anaconda,它集成了Python 解释器、众多科学计算包以及强大环境管理器。我们在官网之间下载对应操作系统即可(但需要注意的是本期仅适用于window系统,如果是Mac会有些许不同,但笔者没有Mac系统的设备所以没法分享了)
下载完后就可以直接用了,多年不用感觉anaconda好用了很多,笔者当初好像设置jupyter notebook好像还废了番功夫,但是现在下载完Anaconda后,我们可以打开Anaconda Navigator
在这里直接可以使用,甚至还集成了一些其他工具。
不过我们本期并不是局限于此,我们在升级R版本时候需要在Rstudio中进行全局设置,有读者可能会发现这个
可以看到,其实Rstudio本身作为ide就可以运行Python代码,甚至在一些包的帮助下我们可以在一个工作中即使用R,又使用Python。
不过在想这么使用之前需要先行配置下
首先就在Anaconda Prompt 中进行
打开后输入conda create --name r-reticulate python=3.10
它创建了一个名为r-reticulate 的环境,并指定使用 Python 3.10 版本(这是一个稳定且广泛兼容的版本)
之后会提示将要安装一些基础包,输入y 并按回车确认
创建成功后,会提示如何激活。输入conda activate r-reticulate
激活后我们可以发现在base前就显示环境
之后我们需要在Rstudio中配置Python环境
首先打开后我们需要的包为
我们想一劳永逸的使用的话,需要设置RStudio使用的Python路径
首先,我们需要找到 r-reticulate 环境中 Python 解释器的确切路径,我们在Anaconda Prompt使用where python来寻找路径,会出现很多个,我们要选择第一个路径。
同时这里需要注意,当我们在R中输入地址,不能使用“\”,因为R 只识别“/”所以要把路径进行符号的变换。
我们需要打开R控制台,如果有usethis包的话我们可以直接usethis::edit_r_environ()打开
那之后我们需要在控制台输入
RETICULATE_PYTHON="真实路径"
可以看到结果如图
可以看到这个环境还是红色的,它表示没有保存,之后我们保存下(点击控制栏的保存按钮即可)
可以看到就保存成功了
之后我们关闭,重新打开
使用reticulate包
可以看到
显示当前环境
我们可以使用repl_python()来进入python环境
我们可以看到,已经进入了python环境,不仅是左上角图标变成了Python,每行也是>>>
我们可以在rstudio中进行print(“hello world”)
如果需要退出,输入exit即可
可以看到整体回到了R环境