当前位置：首页>Linux>为什么Windows压缩的zip到Linux就变乱码?而rar却不会?

为什么Windows压缩的zip到Linux就变乱码?而rar却不会?

2026-07-03 20:56:53

上次我们聊了ZIP、RAR、7z的区别：

.zip、.rar、.7z 到底有什么区别？压缩包的原理是什么？

有位读者在评论区问了一个特别好的问题：

“为什么Windows压缩的zip文件名到Linux就变乱码？而rar却不会？”

你有没有过这样的经历：在Windows上辛辛苦苦整理了一堆中文名的文件，打包成zip，发给了用Linux的小伙伴。结果对方一解压，满屏的“绋肩�名.zip”之类的乱码，瞬间血压飙升。而换成rar格式，居然就一切正常？

这到底是玄学还是技术问题？今天我们就来把这个“跨平台乱码”的谜底彻底揭开。

先上结论：就是“语言不通”

简单来说，Zip和Rar在存储文件名时，用了不同的“语言”（编码）。

Zip 像个老古董，它用的是一种“方言”（Windows本地编码，比如GBK）。
Rar 则比较新潮，直接用了“世界语”（Unicode）。

当你的Linux小伙伴用他的“普通话”（UTF-8）去读Zip里的“方言”时，自然就听天书（乱码）了。而Rar因为存的是世界语，谁都能看懂。

一个生动的比喻：老房东 vs 物业公司

我们可以把压缩包想象成一套房子，文件名就是开门的钥匙。

Zip 是一位“老房东”：他交房时，只给了你一把按照他自己家里的老锁（Windows本地编码，比如GBK）配的钥匙。当你这位新房客（Linux）拿着自己的标准门禁卡（UTF-8）去开门时，肯定打不开。你必须找师傅（转码工具）把钥匙重新打磨一下，才能进去。
Rar 是一家“专业物业公司”：他们从一开始就统一使用智能门锁（Unicode）。不管你是谁，只要拿着支持智能门锁的门禁卡（任何现代操作系统），都能轻松开门。钥匙是通用的，自然就不会乱码。

为什么Zip会留下这个“坑”？

Zip格式诞生于1989年，那时候互联网还没普及，更没人想到会有“跨平台”这回事。Zip的设计规范里，压根就没规定文件名应该用什么编码。所以压缩软件在打包时，就顺手用了操作系统当前的默认编码。

在简体中文Windows上，默认编码是 GBK（或GB2312）。
在Linux上，默认编码是 UTF-8。

GBK和UTF-8对同一个汉字的表示方式完全不同。当解压工具（比如Linux的unzip）看到一堆字节时，它并不知道这是GBK编码的，只能傻傻地按UTF-8去解读。结果就是：本应是一个汉字，却被拆成了几个奇怪的符号，乱码就这么产生了。

为什么Rar能避免乱码？

Rar格式诞生于1993年，比Zip晚了几年。它的设计者显然吸取了教训，在格式规范中明确支持 Unicode。

当你在Windows上用WinRAR压缩中文文件时，Rar会自动把文件名“翻译”成Unicode（一种全球统一的字符集）存储到压缩包里。无论在哪个操作系统上解压，只要解压软件支持Unicode（现在基本上都支持），它就能准确地把Unicode还原回原来的中文文件名。这就彻底解决了“语言不通”的问题。

Zip vs Rar 的跨平台友好度对比

特性	Zip	Rar / 7z
诞生年份	1989	1993 (Rar)
编码策略	无强制标准，依赖系统本地编码（如GBK）	明确支持Unicode
跨平台兼容性	差，非英文文件名极易乱码	好，只要解压软件支持Unicode就正常
历史包袱	有，老旧规范限制	无，设计时已考虑全球化

如何避免乱码？给你几个实用建议

1. 压缩时（如果你是发送方）

尽量不用Windows自带的zip：Windows的“发送到→压缩文件夹”功能对中文支持极差，是乱码的罪魁祸首之一。
用现代压缩软件：

7-Zip：免费且跨平台，压缩时默认使用Unicode，强烈推荐。
WinRAR：格式本身就支持Unicode，直接压缩成rar即可。
Bandizip（旧版）、PeaZip等也都很友好。

压缩前改英文名：最粗暴但有效的方法，如果你知道对方是Linux，可以把所有文件名改成英文再打包。

2. 解压时（如果你是接收方）

如果不幸收到了一个乱码的Zip包，别急着摔键盘，试试这些工具：

Linux/macOS：使用 unar 命令，它能自动检测编码并正确解压。

ounter(lineounter(linesudo apt install unar   # Debian/Ubuntuunar 乱码文件.zip

Windows：用7-Zip或Bandizip打开，它们一般都能自动识别GBK编码，不乱码。
用unzip -O指定编码（Linux，知道是哪一个编码）：

ounter(lineunzip -O GBK 乱码文件.zip

如果知道压缩时用的是GBK，强制用GBK解压即可。

事后改名：如果已经解压出一堆乱码文件，可以用 convmv 工具批量转换文件名编码。

3. 通用原则

尽量使用7z或rar格式，它们对Unicode的支持最完善。
如果你一定要用zip，确保你的压缩软件支持“文件名编码为UTF-8”的选项（比如7-Zip、WinRAR的zip模式），并在压缩前勾选。

总结

乱码问题的本质，是Zip格式诞生太早，没跟上全球化的步伐，留下了一个“编码未指定”的坑。而Rar作为后来者，直接采用了Unicode，完美避开了这个坑。

现在，当你下次给Linux小伙伴发文件时，可以自豪地说：“别用zip了，用rar或者7z吧，保证不乱码！”如果对方反问为什么，你就可以把这篇文章甩给他——不仅解决了问题，还涨了姿势。

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。

为什么Windows压缩的zip到Linux就变乱码?而rar却不会?

先上结论：就是“语言不通”

一个生动的比喻：老房东 vs 物业公司

为什么Zip会留下这个“坑”？

为什么Rar能避免乱码？

Zip vs Rar 的跨平台友好度对比

如何避免乱码？给你几个实用建议

1. 压缩时（如果你是发送方）

2. 解压时（如果你是接收方）

3. 通用原则

总结

最新文章

热门文章

随机文章

为什么Windows压缩的zip到Linux就变乱码?而rar却不会?

先上结论：就是“语言不通”

一个生动的比喻：老房东 vs 物业公司

为什么Zip会留下这个“坑”？

为什么Rar能避免乱码？

Zip vs Rar 的跨平台友好度对比

如何避免乱码？给你几个实用建议

1. 压缩时（如果你是发送方）

2. 解压时（如果你是接收方）

3. 通用原则

总结

Linux认证大盘点:红帽认证、Oracle、华为欧拉、麒麟认证……到底该选哪个?

高级 Linux 持久化:在 Linux 目标内部保持存在的策略

最新文章

热门文章

随机文章