生信分析,Linux是绕不开的坎。别怕,今天带你一口气搞定最常用的20条命令,从此终端不再是噩梦!
各位小伙伴,刚入门生信的时候,是不是被黑乎乎的终端窗口吓到过?鼠标点不了,全靠敲命令,感觉像回到了原始社会……
但其实,常用的Linux命令也就那么20来个!今天我就用最白话的方式,给你捋一遍生信分析中真正会用到的那些命令。学完这篇,你就能在服务器上自由“游泳”了~
废话不多说,上干货!
1. ls —— 看一眼目录里有啥
作用:列出目录内容,就像打开文件夹看看里面有什么文件。常用选项:
-l:显示详细信息(权限、大小、修改时间)
-a:显示所有文件,包括隐藏文件(以.开头的)
-h:人性化显示文件大小(比如 4K、10M)
生信场景:查看下机的fastq文件、比对生成的bam文件。
2. cd —— 去哪个目录
作用:切换当前工作目录。常用:
cd ~:回家目录
cd ..:返回上一级
cd -:回到刚才的目录
3. pwd —— 我在哪
作用:显示当前所在目录的绝对路径。迷路的时候特别好用。
4. mkdir —— 建个新文件夹
作用:创建目录。常用:mkdir -p 可以一次性创建多级目录(父目录不存在也会自动建)。
mkdir-p results/fastqc_results
5. rm —— 删东西(慎用!)
作用:删除文件或目录。Linux没有回收站,删了就真没了!常用:
rm-rf temp_folder # 危险操作,请确认再敲
建议:先 ls 确认要删的东西,再 rm。
【图片1:命令概览思维图】
6. cp —— 复制文件或目录
作用:复制。常用:-r 复制目录,-i 覆盖前询问。
cp-r raw_data/ backup_data/
7. mv —— 移动或改名
作用:移动文件/目录,或者重命名。
mv old_name.txt new_name.txt # 改名mv result.txt ../analysis/ # 移动
8. cat —— 直接看整个文件
作用:输出文件全部内容。适合看小文件,大文件会刷屏。
9. less —— 翻页查看大文件
作用:分页查看文件内容,按空格翻页,按q退出。生信必备,因为fastq、gtf等文件都很大。
less huge.fastq# 按 / 然后输入关键词可以搜索
10. head / tail —— 只看头或尾
作用:head显示前10行,tail显示后10行。常用:-n 指定行数。
head-n20 sample.fastq # 看前20行tail-f running.log # 实时追踪日志更新(-f超好用)
【图片2:head和tail效果对比图】

11. grep —— 按关键词搜内容
作用:在文件(或输入)中搜索匹配的行。生信里用它找序列ID、筛选基因名。常用:-v 反选(不要含关键词的),-c 计数,-i 忽略大小写。
grep">" sequences.fasta # 提取fasta文件的标题行grep-v"^#" config.txt # 去掉注释行
12. awk —— 文本处理的瑞士军刀
作用:按列处理文本,可以加条件、计算。常见用法:打印某一列、求和、筛选。
awk'{print $1}' data.txt # 打印第一列awk'$3 > 0.05 {print $0}' result.txt # 第三列大于0.05的行
13. sed —— 流编辑器,查找替换
作用:替换、删除、插入文本行,常在管道中配合使用。
sed's/old/new/g' file.txt # 全局替换sed-i's/chr1/1/' annotation.gtf # 直接修改文件(小心)
14. cut —— 切出某一列
作用:按分隔符取出指定列。比awk轻量。
cut-f1,3-d$'\t' genes.bed # 制表符分隔,取第1和第3列
15. sort —— 排序
作用:按行排序。常用:-n 按数字排序,-r 降序,-k 指定排序列。
sort-k2-n expression.txt # 按第二列数字排序
16. uniq —— 去重(要配合sort)
作用:去除相邻的重复行。所以一般先sort再uniq。常用:-c 统计重复次数。
【图片3:文本处理管道示意(grep + awk + sed)】

17. wc —— 统计行数、字数
作用:Word Count。常用:-l 只统计行数(生信最常用),-c 字节数。
wc-l sample.fastq # 统计fastq的行数,除以4得到reads数
18. find —— 找文件
作用:在目录树中搜索符合条件的文件。常用:按名字、大小、修改时间找。
find.-name"*.bam"# 当前目录下所有bam文件find /data -size +100M # 大于100M的文件
19. tar —— 打包/解包
作用:归档多个文件成一个文件(不压缩)。常配合压缩。常用:
tar -cvf 创建归档
tar -xvf 解包
加 -z 处理 .gz,加 -j 处理 .bz2
tar-czvf results.tar.gz results/ # 打包并压缩tar-xzvf results.tar.gz # 解压
20. gzip / gunzip —— 单文件压缩
作用:压缩/解压 .gz 文件。生信数据经常是 .fastq.gz 格式。
gzip large.fastq # 生成 large.fastq.gzgunzip large.fastq.gz # 解压回来zcat large.fastq.gz |head# 直接看压缩文件内容
【图片4:20条命令快速索引表】
【图片5:文件操作示例(cp/mv/rm的对比)】

【图片6:生信常用文件操作小抄】

最后总结
学Linux命令,不要死记硬背,多用、多查才是王道。你可以:
把这篇文章收藏起来,遇到忘了的回来翻。
每天在服务器上敲一敲,练成肌肉记忆。
遇到复杂操作,用 man 命令名 或 命令 --help 查看帮助。
这20条命令足够你应对90%的生信分析场景了。剩下的10%,等遇到了再去百度也不迟~
觉得有用的话,点个赞、转给需要的朋友吧!下期你想看什么? 可以留言告诉我~