事情的开头特别美好:我的 DAG skill编排平台在 Linux 上跑得风生水起,某天想咱也支持一下 Windows 呗,Python 不是跨平台吗?应该改改路径就完事儿了。毕竟现在大模型的能力这么强。
然后,噩梦开始了。(也做了计划,看上去很详细,然后执行后效果一言难尽,挂一漏万呐)
反斜杠被神秘力量吃掉、GBK 吞掉 Emoji 直接炸掉文件 I/O、全角引号转换与字符串定界撞车、PowerShell 的 cd 根本不按 Bash 的套路出牌、……
最终,我们花了数天、提交了 10+ 个 Windows 兼容性 相关commit,才让这套代码在 Win10/Win11 上跑得像个人样。
这不是“为了兼容而兼容”的水文。这是用血泪换来的一次渡劫实录。下面,按致命程度从高到低,把最离谱的坑和处置一个个拆开。
最后是8条戒律分享,中间有免费的Opus4.7可用链接。
如果你只记住一件事,请记住:在 Windows 上,永远不要依赖默认编码。
这是第一个发现的致命 bug,影响面最大。
我的 SkillRegistry 缓存里,大大方方用着 ✅ 标记状态。Linux 上岁月静好,中文 Win10 上一读写缓存就直接升天。
原因很简单:Python 在 Windows 上默认用系统 ANSI 代码页,中文 Win10 是 cp936(GBK 超集)。GBK 完全不认识 ✅ 这类 Emoji,Path.write_text() 直接抛出 UnicodeEncodeError。
处置:所有文件 I/O 全部显式指定 `encoding='utf-8'`,无一例外。
最初的方式是将所有的Emoji全都替换成Ansi的[Y]、[N],一时间解决了问题,但是看看输出有点磕碜,想想还是不能Workaround就算了。涉及文件 7 个:analyzer.py(缓存读写、skill.md 读取)、server.py(auth/env 读取)、prompt_assembly.py(股票名称映射)等。
没有任何“平台判断”的余地,全局强制 UTF-8 就对了。
文件读写改了,子进程呢?subprocess.Popen 返回的 stdout/stderr 是 bytes,Windows 上默认 decode 还是 GBK。于是子进程输出的 Emoji 又炸了。
处置:所有 subprocess 统一 decode('utf-8', errors='replace'),同时服务器启动时强制重定向标准流:
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf-8')
sys.stderr = io.TextIOWrapper(sys.stderr.buffer, encoding='utf-8')
os.environ["PYTHONIOENCODING"] = "utf-8"
LLM 生成的代码偶尔带“排版美学”,比如:
⚠️ 风险警示条件
if risk_score > 0.8:
Linux 终端显示完美,Python 解释器直接报 SyntaxError: invalid character '⚠'。
处置:代码执行前增加 `_normalize_markdown_artifacts()` 扫描,行首 Emoji/特殊符号自动转注释:
# [AUTO-COMMENTED by executor] ⚠️ 风险警示条件
涵盖整个杂项符号平面(U+2600-U+27BF)和 Emoji 平面(U+1F300-)。就这么离谱,你还不能骂 LLM,毕竟它是“好心”。
我们有一个全角标点转半角的函数,本是好意。但它把 " (U+FF02) 和 ' (U+FF07) 也转成了 ASCII 的 " 和 '。
LLM 偏偏爱用全角引号括中文——比如 使用"4433法则"筛选——转换后,"4433法则" 里的引号直接和 Python 字符串定界符撞车,SyntaxError 一脸无辜。
处置:转换循环中跳过 U+FF02 和 U+FF07,保留原字符。
所以说,不是所有“规范化”都值得感谢。
Linux使用正斜杠/,Windows原生使用反斜杠\。硬编码路径在跨平台场景下会导致API调用失败。
处置: 统一使用os.path.join()或pathlib.Path进行路径构造。
如:log_path = "/var/log/app.log" (Unix中多简单)
转为:log_path = os.path.join("var", "log", "app.log")
或者:log_path = Path(__file__).parent / "logs" / "app.log" (看着头晕)
你以为 pathlib 保你平安?它只能保一半,另一半得靠你躲坑。
代码里用 shlex.split() 解析命令字符串,这函数的默认模式是 POSIX,把 \ 当转义前缀。
Windows 路径 E:\skills\scripts\tool.py 里的 \s、\t 被当成转义序列,路径秒变 E:skillsscriptstool.py。
起初想用 posix=False 绕,但 shlex.quote() 在 Windows 上也是灾难——它用单引号包裹,完全不适用。
最终方案:彻底放弃 shlex,写了一个自定义 `_split_args()`,逐字符解析,双引号感知,反斜杠当字面量保留。
不到 50 行代码,替代了一个标准库函数,但它正确。
def _split_args(s: str) -> list:
"""Split a command string into arguments.
Handles double-quoted strings and treats backslashes as literal
(Windows-safe, unlike shlex which escapes backslashes).
"""
args = []
current = ''
in_quote = False
for ch in s:
if ch == '"':
in_quote = not in_quote
elif ch in (' ', '\t') and not in_quote:
if current:
args.append(current)
current = ''
else:
current += ch
if current:
args.append(current)
return args
Linux 习惯敲 python3,Windows 只有一个 python.exe。多处硬编码 "python3" 作为子进程命令,到了 Win 直接 FileNotFoundError。
处置:全部替换为 `sys.executable`,指向当前解释器绝对路径。绝不再写死任何可执行文件名。配合 pathlib 的 / 操作符,路径拼接不再出现正反斜杠混用。
f"{SOME_PATH}/index_documents.py" 这种写法在 Windows 上产生混用路径:E:\path\to\scripts/index_documents.py,部分 Windows API 不认。
处置:全部改用 pathlib 的 / 操作符拼接,自动处理为正确的平台分隔符。
LLM prompt 模板里写死了 /tmp/skill_build/ (这是之前图省事犯的错),Windows 根本没有这个路径。换成 tempfile.gettempdir() 动态获取,并配合占位符替换。
另外,Linux 文件系统大小写敏感,Windows 不敏感,所以我们把所有文件名比较都加了 .lower() 或 .casefold(),一共改了配置加载模块的 3 处。
Windows 的 Shell 世界和 Linux 完全不是同一种生物。
LLM 生成的命令经常是 cd E:\skills\...; python scripts/tool.py "args"。executor 判定是 Shell 脚本,写入 .ps1 用 PowerShell 执行。但 PowerShell 的分号 ; 行为和 Bash 不同,子进程 CWD 和 .env 查找全乱套。
三层修复:
·Prompt 层:直接告诉 LLM“别用 cd,传绝对路径”
·Executor 层:正则检测 cd <path>; python <args> 模式,自动解析为绝对路径,直接用 sys.executable 执行
·CWD 修复:显式设置 cwd = os.getcwd()(项目根目录)
某些 Win 环境里,PowerShell 启动时用 DPAPI 加载加密凭据失败,报 8009001d 错误,整个脚本执行崩溃。
处置:
·所有 PowerShell 调用强制加 -NoProfile 跳过 profile 加载
·检测到 DPAPI 错误时,自动 fallback 到 cmd.exe /c 执行,把脚本转写成 .bat 文件
·mkdir -Force 自动转换为 if not exist ... mkdir
TIPS:这个问题使用Deepseek v4 pro修复了多次,但是都不成功 (没办法,opus不能用了)。后来在https://anyrouter.top/register?aff=yihB 发现这个免费的Claude模型服务站终于不再429了,opus4.7很快帮助定位了问题,感谢!
子进程里 Python 的 SSL 验证失败,原因是环境变量白名单里没有 Windows 系统变量。ssl 模块需要 SYSTEMROOT 来定位根证书存储,ComSpec 和 PATHEXT 也是系统正常运行所需。
处置:把 SYSTEMROOT、SystemRoot、ComSpec、PATHEXT 加入子进程透传的环境变量白名单。
run.bat 用 start /B 启动服务器,stdout 被 detach 后,print() 直接报 I/O operation on closed file。
处置:把生产代码里的 print() 全换成 logger.debug()。
教训:生产环境别用 print 调试。同时给 start /B 启动的进程加上 PYTHONUNBUFFERED=1,确保日志实时写入。
Linux 下的多进程靠 fork(),Windows 没有这东西。我统一换成 subprocess.Popen,在 Win 下用 CREATE_NEW_PROCESS_GROUP 标志模拟进程组隔离。
if sys.platform == "win32":
# Windows 平台创建子进程
proc = subprocess.Popen(
["python", "worker.py"],
creationflags=subprocess.CREATE_NEW_PROCESS_GROUP
)
else:
# Linux / macOS 平台 fork 进程
pid = os.fork()
if pid == 0:
os.execvp("python", ["python", "worker.py"])
改造后,所有 fork 调用完全移除,代码只依赖 subprocess。
Windows 对 POSIX 信号支持非常有限,直接 signal.signal(signal.SIGTERM, handler) 会引发 AttributeError。
处置:通过 `sys.platform != "win32"` 条件判断,只在非 Windows 注册信号处理器,Win 下优雅降级。
def handler(signum, frame):
print("Signal received")
# 非 Windows 平台注册信号
if sys.platform != "win32":
import signal
signal.signal(signal.SIGTERM, handler)
Windows 没有 Unix 执行权限位,os.chmod("./script.sh", 0o755) 只能修改只读属性,基本无效。
处置:仅在非 Windows 平台执行权限设置,Win 下依赖文件扩展名关联或用户手动赋权。
if sys.platform != "win32":
os.chmod("./script.sh", 0o755)
迁移做完后,我总结了一份“求生法则”,适合每位做 Python 跨平台开发的兄弟:
路径始终用跨平台模块 `pathlib.Path` ——绝不手动拼斜杠
文件 I/O 始终显式 `encoding='utf-8'` ——永远不依赖系统默认编码
子进程用 `sys.executable` ——绝不硬编码 python3 或 python
字符串分割用自定义 parser ——Windows 反斜杠不是转义符
环境变量白名单要包含 Windows 系统变量 ——SYSTEMROOT/ComSpec/PATHEXT
PowerShell 加 `-NoProfile` ——绕过 DPAPI 问题
`print()` 在生产代码中用 `logger` ——start /B 会 detach stdout
`start /B` 启动的进程用 `PYTHONUNBUFFERED=1` ——确保日志实时写入
很多朋友说“Python 跨平台”,这当然没错,但那只是语法层面的跨平台。一旦涉及系统调用、Shell 交互、编码处理、进程管理,Windows 和 Linux 就是彻彻底底的两个世界。
这次迁移覆盖了路径、编码、Shell、子进程、前端等几乎所有层级,每一个坑都是用真实的 commit 和调试时间填出来的。
如果你也在做类似的事情,或者曾经踩过类似的坑,欢迎在评论区分享你的“血泪史”。这 10+ 个离谱 bug 对应的 commit 记录都留着,感兴趣的朋友咱们评论区细聊。
往期部分内容:
花了1小时,我把巴菲特炼成了AI:24小时免费咨询,还不用分樱桃可乐
当Qwen、GLM、Kimi集体翻车,只有DeepSeek-V4-Pro懂我的意思
重磅:Claude Code WebUI 开发成功!源码分享,功能接近Cowork
Claude Code封杀第三方API?我直接改源码实现全兼容!v2版分享
Claude Code 泄漏之三:从输入到输出内部执行全流程揭秘
6块8基本跑通Claude Code泄漏源码!我把Anthropic的"黑箱"撬开了