医学生的我,Python和R,该学哪个,如何正确从入门到精通?

如今,数据就是资源,是生产资料,有了数据,就有了实现一切的基础。这里数据主要指大数据,包括测序数据(如RNA-seq)、图像(如CT、MRI结果图)等多种类型,当然数据还包括湿实验数据等,我们这里不做展开。想要利用生产资料制造产品,创造价值,我们就要有生产工具。同样的,数据是生产资料,数据分析后写出来的文章就是产品,那生产工具是什么呢?那Python和R在医学大数据分析中的具体应用有哪些异同?鉴于本人并非大数据分析相关方向背景,仅根据个人科研历程见闻体会,简要介绍一下二者的异同,以及在医学领域应用场景选择,如有遗漏,欢迎大佬补充讨论~- 不论Python还是R语言,都是通过按照语言规则输入代码,实现数据建模、分析、可视化和机器学习等功能。
- Python侧重于程序开发,机器学习和神经网络,需要有一定的编程基础;R语言侧重于数据分析及可视化,只要有SPSS软件操作经验,很容易上手;
- Python在医学领域主要应用于机器学习,神经网络。最典型的是医学影像图片的AI识别,feature提取和构建神经网络,机器学学习,建立诊断模型,这类文章可以参考我之前帖偏重临床,动物模型都没有的课题该怎么做?。需要注意的是,利用Python构建疾病诊断模型,往往是一个比较大的project,需要一个团队完成,所以不适合个人上手。
- R语言在医学领域非常擅长针对测序数据的分析和可视化(RNA-seq/单细胞测序等等)、临床回顾性统计分析等。当然Python也可以进行数据分析可视化,但是相比而言,R语言更有优势,也更容易上手。
实际上,结合身边生信团队情况,医学研究生或医务人员应该优选学习R,对于测序上游数据分析再具备一点linux基础就够了,Python不建议选择。那如何学好R语言,正确入门掌握R语言的思路是什么?
据身边专门做生信的同学成长经历可知,没有捷径,需要投入足够时间,以下入门思路供参考:- 刚开始入门的话,建议集中花个一周时间,自己按照《R语言实战这本》这本书,边学边敲代码,熟悉一下基本概念和基本操作;
- 然后可以再找几个视频课程(可以B站找找,当然免费的课程质量只能凑合看)跟着练,掌握一些改代码和debug的技巧(这一步可能要断断续续花一个月)。适当的再参加一些线上、线下的培训课程(大概也要一个月的时间。培训课程方面,比较推荐玮瑜科研平台的相关课程,这是看了那么多培训课程中质量比较高,干货很多,但是非免费的,看个人情况决定)。
- 当入门(能够独立改代码和debug)之后,可以找一些小项目跟着复刻(推荐简生信技能树公众号上找一下项目练手)。
经过以上几步大概3-4个月的时间投入,相信生信分析基本可以掌握!注:欢迎转发分享,点赞、收藏、在看~
欢迎关注BioAdvance,获取更多精彩内容~