ython 以简洁易读著称,但在日常开发中,一些不经意的 “坏习惯” 会让代码变得难以维护、隐藏 Bug,甚至影响性能。这份汇总不仅会帮你识别常见的编码陷阱,还会通过对比和解析,让你明白 “为什么要这么改”,写出更专业的 Python 代码。字符串拼接是 Python 中最常见的操作之一,但很多初学者会习惯性用 + 连接字符串。这种方式在简单场景下看似没问题,一旦遇到多变量、复杂表达式或需要格式化输出时,代码就会变得臃肿且容易出错。# ❌ 坏习惯:依赖手动关闭,异常场景下风险高file = open("example.txt", "r")content = file.read()file.close() # 若前面代码抛出异常,这行不会执行# ✅ 好习惯:上下文管理器自动处理资源释放withopen("example.txt", "r") asfile: content = file.read()# 代码块结束后,文件自动关闭,无需额外操作
理由:使用 + 进行字符串拼接会导致代码可读性差,而且在复杂情况下容易出错,f-string 可读性更好。
2. 手动关闭文件
文件操作是 I/O 密集型任务,手动调用 close() 不仅容易遗忘,还可能在代码抛出异常时导致文件句柄泄漏,长期运行会耗尽系统资源。
# ❌ 坏习惯:依赖手动关闭,异常场景下风险高file = open("example.txt", "r")content = file.read()file.close() # 若前面代码抛出异常,这行不会执行# ✅ 好习惯:上下文管理器自动处理资源释放withopen("example.txt", "r") asfile: content = file.read()# 代码块结束后,文件自动关闭,无需额外操作
理由:手动关闭文件容易忘记,使用上下文管理器(with 语句)会在代码块执行完毕后自动关闭文件,即便发生异常也会被正确处理,更加安全可靠。
3、使用裸 except 子句
异常处理的目的是精准捕获并处理预期错误,而裸 except 会捕获包括 KeyboardInterrupt(用户中断)、SystemExit(程序退出)在内的所有异常,掩盖真正的问题,让调试变得异常困难。
# 坏习惯try: result = 10 / 0except: print("Error occurred")# 好习惯try: result = 10 / 0except ZeroDivisionError: print("Error occurred")
理由:裸 except 会捕捉所有异常,包括系统退出信号等,这可能导致在处理异常时掩盖真正的错误,使得调试变得更加困难。
4、默认参数使用可变对象
Python 的默认参数在函数定义时就会被计算,而不是在调用时。如果默认参数是列表、字典等可变对象,它会在所有函数调用之间共享,导致意外的状态残留。
# 坏习惯def add_item(item, items=[]): items.append(item) return items# 好习惯def add_item(item, items=None): if items is None: items = [] items.append(item) return items
理由:默认参数在函数定义时被计算,而不是在每次函数调用时。这意味着如果默认参数是可变对象(如列表或字典),那么它将在所有函数调用之间共享,导致意外的结果。
5、不会使用推导式
循环构建列表、字典是常见场景,但冗长的 for 循环 + append 会让代码显得笨重。推导式是 Python 特有的语法糖,能在一行内完成集合的构建,兼具简洁性和可读性。
# 坏习惯squares = []for i in range(5): squares.append(i ** 2)# 好习惯squares = [i ** 2 for i in range(5)]
理由:推导式是一种简洁、可读性高的语法糖,可以减少代码行数,提高效率。
6、使用 type(x) 检查类型
type(x) 会严格检查对象的类型,无法处理继承关系。而 Python 是动态类型语言,很多场景下我们需要判断对象是否 “是某种类型的实例”(包括子类),这时候 isinstance 更灵活。# 坏习惯value = 42if type(value) is int: print("It's an integer")# 好习惯value = 42if isinstance(value, int): print("It's an integer")
理由:type 不如 isinstance 灵活,且无法处理继承关系。
7、使用 == 判断是否为 None、True 或 False
None、True、False 是 Python 中的单例对象,每个对象在内存中只有一个实例。使用 == 会调用对象的 __eq__ 方法,可能被重载导致意外结果;而 is 直接比较对象的内存地址,能确保判断的准确性。# 坏习惯if x == None: print("x is None")# 好习惯if x is None: print("x is None")
理由:在 Python 中,None、True 和 False 是单例对象,使用 is 能确保比较的是对象的身份。另外,对象的 __eq__ 方法可以被重载,这就意味着 == 可能不总是按照我们期望的方式进行比较。
8、使用 bool(…) 或 len(…) 进行条件检查
Python 中的容器(列表、字典、集合等)和对象都有 “真值” 概念:空容器、None、0 等为假,非空容器、非零值等为真。显式检查 len() 或 bool() 是冗余的,直接用对象本身作为条件更简洁。
# 坏习惯my_list = [1,2,3]if len(my_list) != 0: print("List is not empty")# 好习惯my_list = [1,2,3]if my_list: print("List is not empty")
理由:在条件判断时使用可读性更高的表达式,不必显式地检查长度或真值。
9、使用 range(len(…)),而不是 enumerate
遍历列表时,很多人会用 range(len(list)) 生成索引,再通过索引取值。这种方式不仅代码冗长,还容易因索引错误导致 Bug。enumerate 可以同时获取索引和值,是遍历序列的优雅方式。
# 坏习惯my_list = ['apple', 'banana', 'orange']for i in range(len(my_list)): item = my_list[i] print(i, item)# 好习惯my_list = ['apple', 'banana', 'orange']for i, item in enumerate(my_list): print(i, item)
理由:enumerate() 提供了在迭代中同时获取索引和值的优雅方式,比手动追踪索引更好。
10、不了解字典的 items 方法
遍历字典时,直接迭代键再通过 dict[key] 取值是常见的低效写法。字典的 items() 方法会返回键值对的迭代器,让你在一次循环中同时获取键和值,避免额外的字典查找开销。
# 坏习惯my_dict = {'a': 1, 'b': 2, 'c': 3}for key in my_dict: print(key, my_dict[key])# 好习惯my_dict = {'a': 1, 'b': 2, 'c': 3}for key,value in my_dict.items(): print(key,value)
理由:items() 提供了更直接的方式同时获取键和值,避免了额外的字典查找。
11、不使用元组解包
元组、列表等可迭代对象的解包是 Python 中非常实用的特性,能让你在一行内完成多个变量的赋值,避免通过索引取值的繁琐。
# 坏习惯coordinates = (3,5)x = coordinates[0]y = coordinates[1]# 好习惯coordinates = (3,5)x, y = coordinates
理由:元组解包能够使代码更加简洁,提高可读性。
12、使用 time() 进行代码计时
time.time() 返回的是系统时间,会受系统时钟调整(如 NTP 同步、夏令时变化)的影响,不适合测量小段代码的执行时间。time.perf_counter() 是专门为性能测量设计的计时器,提供更高的精度和稳定性。# ❌ 坏习惯:time() 精度低,易受系统时钟影响import timestart_time = time.time()# 执行小段代码end_time = time.time()print(f"耗时: {end_time - start_time:.6f} 秒")# ✅ 好习惯:perf_counter() 高精度计时start_time = time.perf_counter()# 执行小段代码end_time = time.perf_counter()print(f"耗时: {end_time - start_time:.6f} 秒")
工具推荐:如果需要更专业的性能分析,推荐使用 cProfile 模块或 line_profiler 库,它们能帮你定位代码中的性能瓶颈,而不仅仅是测量时间。
13、在生产环境使用 print 语句而不是日志
print是调试时的临时工具,无法控制输出级别、持久化存储或按条件过滤日志。在生产环境中,使用 logging 模块能让你更灵活地管理日志,支持多级别输出(DEBUG/INFO/WARNING/ERROR)、文件存储、日志轮转等功能。# ❌ 坏习惯:转义符让路径难以阅读regular_path = "C:\\Documents\\file.txt"# ✅ 好习惯:原始字符串保留反斜杠raw_path = r"C:\Documents\file.txt"
理由:print 语句是调试的一种方式,但在生产环境中使用日志更为合适,具备更多配置选项和级别。
14、使用 import * 导入模块
from module import * 会导入模块中的所有符号,容易导致命名冲突(如不同模块中的同名函数 / 变量),同时让代码的依赖关系变得不清晰,不利于维护。# ❌ 坏习惯:导入所有符号,命名冲突风险高from math import *print(sin(0.5)) # 不知道 sin 来自哪个模块# ✅ 好习惯:导入特定符号或整个模块from math import sinprint(sin(0.5))# 或import mathprint(math.sin(0.5))
团队协作建议:在多人协作的项目中,明确的导入方式能让其他开发者快速定位符号的来源。遵循 “最小必要导入” 原则,只导入你需要的符号,避免不必要的依赖。
15、不使用原始字符串
处理路径、正则表达式等包含反斜杠的字符串时,普通字符串需要用转义符(\\)表示反斜杠,容易导致代码可读性下降。原始字符串(以 r 开头)会忽略转义符,直接保留反斜杠的原始含义。
# 坏习惯regular_string = "C:\\Documents\\file.txt"# 好习惯raw_string = r"C:\Documents\file.txt"
正则场景:在正则表达式中,反斜杠是常用的转义符(如 \d 匹配数字)。使用原始字符串可以避免双重转义(如 r"\d+" 等价于普通字符串 "\\d+"),让正则表达式更易写易读。
16、不遵循 PEP8 编码规范
PEP8 是 Python 官方的编码风格指南,规定了变量命名、缩进、换行、注释等规则。遵循 PEP8 能让代码风格统一,提升可读性和可维护性,尤其在团队协作中至关重要。
# ❌ 坏习惯:命名不规范,格式混乱aVar=5result=aVar+2# ✅ 好习惯:遵循 PEP8 规范a_var = 5result = a_var + 2
工具推荐:使用 flake8、pylint 等工具可以自动检查代码是否符合 PEP8 规范,black 等格式化工具还能自动修复格式问题,让你无需手动关注细节。
这阵子我正给大家规划学习python ,数据分析,也给大家准备了零基础资料学习包、课件笔记、PDF电子书、问题解答等。都可以在这里免费领取👇