grep(查找)
awk(处理字段)
sort(排序)
uniq(去重)
如果你学过数据库,你会发现:join 本质上就是“文本版的表连接”。今天,我们系统讲清楚 join 的使用方法和实战场景。一、join 是干什么的?
join 的作用是:根据“共同字段”,合并两个文件的内容。SELECT * FROM A JOIN B ON A.id = B.id;
二、join 的基本使用前提
1 Tom
2 Jack
3 Lucy
1 90
2 85
3 88
三、最基础用法
1 Tom 90
2 Jack 85
3 Lucy 88
输出顺序是:连接字段 + file1剩余字段 + file2剩余字段四、指定连接字段
Tom 1
Jack 2
Lucy 3
1 90
2 85
3 88
join -1 2 -2 1 file1.txt file2.txt
五、排序是必须步骤
sort file1.txt -k1,1sort file2.txt -k1,1
六、只输出未匹配行(类似 LEFT JOIN)
join -a 1 file1.txt file2.txt
七、指定输出字段
join -o 1.1,1.2,2.2 file1.txt file2.txt
八、实际应用场景
九、join vs awk 的区别
十、常见参数总结
join -t ',' file1.csv file2.csv
十一、注意事项
总结
它是“文本表连接工具”
必须排序
支持指定字段
支持类似 LEFT JOIN 的操作
在 Linux 文本处理体系中,join 是:结构化文本合并的高效工具。如果你做日志分析、数据处理、脚本开发,join 是值得掌握的一把利器。