当前位置：首页>python>从零到精通:Python 列表操作的系统化学习手册

从零到精通:Python 列表操作的系统化学习手册

2026-07-04 06:16:21

列表（List）是 Python 中使用最频繁的数据结构，没有之一。几乎所有 Python 项目中都能看到它的身影，但大多数开发者对它的了解仅停留在 append()、remove() 这类基础操作上。事实上，列表背后有一套完整的内存管理机制、性能边界和高级用法体系。真正理解列表，不只是知道"怎么用"，更要清楚"为什么这么用"以及"什么场景下不该用"。本文将从底层原理出发，系统梳理 Python 列表的全部核心知识，并结合工程实践给出可落地的建议。

一、列表的底层原理

1.1 列表的内存模型

Python 列表在 CPython 实现中本质上是一个动态数组（Dynamic Array），内部维护了一个连续的指针数组，每个指针指向对应的 Python 对象。这意味着列表存储的并非对象本身，而是对象的引用地址。

import syslst = [1, 2, 3]print(sys.getsizeof(lst))   # 88 字节（Python 3.10，空列表 56 字节）print(sys.getsizeof([]))    # 56 字节# 列表存储的是引用，而非值本身a = [1, 2, 3]b = a           # b 和 a 指向同一个列表对象b.append(4)print(a)        # [1, 2, 3, 4]，a 同步变化

理解这一点至关重要：在传参、赋值、拷贝操作时，混淆"引用"与"值"是绝大多数 Python 列表 Bug 的根源。

1.2 动态扩容机制

列表的容量（capacity）并不等于其长度（length）。当 append() 导致元素数量超过当前容量时，CPython 会按照一套过度分配策略重新申请内存，避免每次添加元素都触发内存重分配：

import syslst = []prev_size = sys.getsizeof(lst)for i in range(20):    lst.append(i)    curr_size = sys.getsizeof(lst)if curr_size != prev_size:        print(f"len={len(lst):>3}, size={curr_size} bytes  ← 触发扩容")        prev_size = curr_size

CPython 的扩容公式大致为 new_capacity = old_capacity + (old_capacity >> 3) + 3，这使得 append() 操作的**均摊时间复杂度为 O(1)**，但在极端场景下单次操作可能耗时 O(n)。

1.3 各操作的时间复杂度

理解复杂度是写出高性能代码的前提：

操作	时间复杂度	备注
`lst[i]`	O(1)	随机访问，核心优势
`lst.append(x)`	O(1) 均摊	尾部插入
`lst.pop()`	O(1)	尾部删除
`lst.insert(i, x)`	O(n)	需移动后续元素
`lst.pop(i)`	O(n)	需移动后续元素
`x in lst`	O(n)	线性搜索
`lst.sort()`	O(n log n)	Timsort 算法
`lst.reverse()`	O(n)	原地翻转
`lst + lst2`	O(n+m)	创建新列表
`lst[i:j]`	O(k)	k 为切片长度

二、列表的创建方式

2.1 字面量与构造函数

# 字面量（推荐，速度更快）lst1 = [1, 2, 3, 4, 5]# 构造函数，可接受任意可迭代对象lst2 = list(range(10))lst3 = list('python')       # ['p', 'y', 't', 'h', 'o', 'n']lst4 = list({'a': 1, 'b': 2})  # ['a', 'b']# 重复操作符zeros = [0] * 10# [0, 0, 0, ..., 0]# ⚠️ 常见陷阱：嵌套列表的重复matrix_wrong = [[0] * 3] * 3# 三行指向同一个列表对象！matrix_wrong[0][0] = 1print(matrix_wrong)  # [[1, 0, 0], [1, 0, 0], [1, 0, 0]]# ✅ 正确做法matrix_right = [[0] * 3for _ in range(3)]matrix_right[0][0] = 1print(matrix_right)  # [[1, 0, 0], [0, 0, 0], [0, 0, 0]]

2.2 列表推导式

列表推导式是 Python 最具代表性的语法特性，不仅语法简洁，在底层实现上也比等价的 for 循环更快（推导式内部使用了 LIST_APPEND 字节码指令，避免了每次循环对 append 的属性查找开销）：

# 基础推导式squares = [x ** 2for x in range(10)]# 带条件过滤evens = [x for x in range(20) if x % 2 == 0]# 多重循环（注意可读性与嵌套层次）pairs = [(x, y) for x in range(3) for y in range(3) if x != y]# 嵌套推导式生成矩阵转置matrix = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]transposed = [[row[i] for row in matrix] for i in range(3)]# 与函数结合import ospy_files = [f for f in os.listdir('.') if f.endswith('.py')]

2.3 性能对比：推导式 vs 循环 vs map

import timeit# 三种方式生成平方数列表的性能对比loop_time = timeit.timeit('result = []\nfor x in range(1000): result.append(x**2)',    number=10000)comp_time = timeit.timeit('[x**2 for x in range(1000)]', number=10000)map_time  = timeit.timeit('list(map(lambda x: x**2, range(1000)))', number=10000)print(f"for 循环:    {loop_time:.3f}s")print(f"列表推导式:  {comp_time:.3f}s")print(f"map+lambda:  {map_time:.3f}s")# 通常结果：推导式 < map+lambda < for循环

三、索引与切片

3.1 正向与反向索引

Python 列表支持负数索引，这是一个在很多其他语言中没有的特性：

lst = ['a', 'b', 'c', 'd', 'e']print(lst[0])   # 'a'print(lst[-1])  # 'e'（等价于 lst[len(lst)-1]）print(lst[-2])  # 'd'# 安全访问：防止 IndexErrordefsafe_get(lst, index, default=None):try:return lst[index]except IndexError:return default

3.2 切片的完整语法

切片语法 lst[start:stop:step] 是列表操作中最强大也最容易被低估的特性：

lst = list(range(10))  # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]# 基础切片print(lst[2:5])     # [2, 3, 4]print(lst[:3])      # [0, 1, 2]print(lst[7:])      # [7, 8, 9]print(lst[:])       # 浅拷贝整个列表# 步长切片print(lst[::2])     # [0, 2, 4, 6, 8]  偶数索引print(lst[1::2])    # [1, 3, 5, 7, 9]  奇数索引print(lst[::-1])    # [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]  反转# 负步长print(lst[8:2:-2])  # [8, 6, 4]# 切片赋值（原地修改，不创建新对象）lst[2:5] = [20, 30, 40]print(lst)  # [0, 1, 20, 30, 40, 5, 6, 7, 8, 9]# 利用切片赋值插入/删除lst[3:3] = [100, 200]  # 插入元素del lst[1:3]           # 删除元素

3.3 使用 slice 对象

在需要复用切片参数时，slice 对象让代码更具可维护性：

# 处理固定格式的数据行record = "John       30 Engineer   120000"NAME   = slice(0, 10)AGE    = slice(11, 13)TITLE  = slice(14, 24)SALARY = slice(25, None)print(record[NAME].strip())    # Johnprint(record[AGE].strip())     # 30print(record[TITLE].strip())   # Engineerprint(record[SALARY].strip())  # 120000

四、增删改查操作详解

4.1 添加元素

lst = [1, 2, 3]# append：尾部追加单个元素，O(1) 均摊lst.append(4)# extend：追加可迭代对象中的所有元素，比 += 语义更清晰lst.extend([5, 6, 7])lst.extend(range(8, 11))# insert：指定位置插入，O(n)，大列表中应慎用lst.insert(0, 0)    # 头部插入，性能最差lst.insert(3, 99)   # 任意位置插入# 运算符lst2 = lst + [100, 101]   # 创建新列表lst += [200]              # 原地扩展，等价于 extend

4.2 删除元素

lst = [10, 20, 30, 20, 40, 20]# remove：删除第一个匹配值，O(n)lst.remove(20)          # [10, 30, 20, 40, 20]# pop：按索引删除并返回，默认删除最后一个last = lst.pop()        # 返回 20，lst = [10, 30, 20, 40]item = lst.pop(1)       # 返回 30，lst = [10, 20, 40]# del：按索引或切片删除，不返回值del lst[0]del lst[1:3]# clear：清空列表，保留列表对象lst.clear()# ⚠️ 常见陷阱：循环中删除元素data = [1, 2, 3, 4, 5, 6]# 错误方式：边遍历边删除，会跳过元素for x in data:if x % 2 == 0:        data.remove(x)print(data)  # [1, 3, 5] ← 错误！实际是 [1, 3, 5]，此例碰巧正确，但对 [1,2,3,4] 会出错# ✅ 正确方式一：生成新列表data = [x for x in data if x % 2 != 0]# ✅ 正确方式二：倒序遍历删除for i in range(len(data) - 1, -1, -1):if data[i] % 2 == 0:del data[i]

4.3 查找与检索

lst = ['apple', 'banana', 'cherry', 'banana', 'date']# in 运算符：O(n)print('banana'in lst)         # True# index：返回第一个匹配的索引，找不到抛出 ValueErrorprint(lst.index('banana'))     # 1print(lst.index('banana', 2))  # 3，从索引 2 开始搜索# count：统计出现次数print(lst.count('banana'))     # 2# 查找所有匹配位置all_indices = [i for i, v in enumerate(lst) if v == 'banana']print(all_indices)  # [1, 3]# 安全查找封装deffind_index(lst, value, default=-1):try:return lst.index(value)except ValueError:return default

4.4 修改元素

lst = [1, 2, 3, 4, 5]# 单个元素修改lst[0] = 10# 切片批量修改（长度可以不同）lst[1:4] = [20, 30]   # [10, 20, 30, 5]# 条件批量修改lst = [x if x > 2else0for x in lst]# 使用 enumerate 同时获取索引和值for i, v in enumerate(lst):if v < 0:        lst[i] = abs(v)

五、排序与反转

5.1 sort() 与 sorted() 的区别

这是 Python 初学者最常混淆的概念之一：

original = [3, 1, 4, 1, 5, 9, 2, 6]# sort()：原地排序，返回 None，修改原列表original.sort()print(original)  # [1, 1, 2, 3, 4, 5, 6, 9]# sorted()：返回新列表，原列表不变lst = [3, 1, 4, 1, 5, 9, 2, 6]new_lst = sorted(lst)print(lst)      # [3, 1, 4, 1, 5, 9, 2, 6]，未变化print(new_lst)  # [1, 1, 2, 3, 4, 5, 6, 9]

5.2 自定义排序键

key 参数是排序的精华所在，接受任意可调用对象，内部使用 Schwartzian Transform（装饰-排序-去装饰）模式，每个元素的 key 函数只调用一次：

# 按字符串长度排序words = ['banana', 'apple', 'cherry', 'fig', 'date']words.sort(key=len)print(words)  # ['fig', 'date', 'apple', 'banana', 'cherry']# 按字典字段排序people = [    {'name': 'Alice', 'age': 30, 'score': 85},    {'name': 'Bob',   'age': 25, 'score': 92},    {'name': 'Charlie', 'age': 30, 'score': 78},]# 单字段排序people.sort(key=lambda p: p['age'])# 多字段排序（先按 age 升序，再按 score 降序）from operator import itemgetterpeople.sort(key=lambda p: (p['age'], -p['score']))# operator.itemgetter 比 lambda 性能略优people.sort(key=itemgetter('age'))# 对象属性排序from operator import attrgetterclassStudent:def__init__(self, name, gpa):        self.name = name        self.gpa  = gpadef__repr__(self):returnf"Student({self.name}, {self.gpa})"students = [Student('Alice', 3.8), Student('Bob', 3.5), Student('Charlie', 3.9)]students.sort(key=attrgetter('gpa'), reverse=True)

5.3 稳定排序与 Timsort

Python 的排序算法是 Timsort，它是一种混合排序算法（归并排序 + 插入排序），具有以下特性：

稳定排序：相等元素的相对顺序保持不变，这对多字段排序至关重要
对于已部分排序的数据，性能接近 O(n)
最坏时间复杂度 O(n log n)，空间复杂度 O(n)

# 利用稳定性实现多字段排序的另一种方式# 先按次要字段排，再按主要字段排data = [('Alice', 30), ('Bob', 25), ('Charlie', 30), ('David', 25)]data.sort(key=lambda x: x[0])  # 先按姓名排（次要）data.sort(key=lambda x: x[1])  # 再按年龄排（主要），同年龄者保持姓名顺序

5.4 反转列表

lst = [1, 2, 3, 4, 5]# reverse()：原地反转，O(n)，返回 Nonelst.reverse()# reversed()：返回迭代器，不创建新列表for item in reversed(lst):    print(item)# 切片反转：创建新列表new_lst = lst[::-1]

六、拷贝：浅拷贝与深拷贝

6.1 浅拷贝的多种方式

original = [1, [2, 3], [4, 5]]# 四种浅拷贝方式，效果等价copy1 = original[:]copy2 = original.copy()copy3 = list(original)import copycopy4 = copy.copy(original)# 浅拷贝的局限：嵌套对象仍共享引用copy1[0] = 99# 不影响 originalcopy1[1].append(9)  # ⚠️ 影响 original！print(original)     # [1, [2, 3, 9], [4, 5]]

6.2 深拷贝

当列表包含嵌套的可变对象时，必须使用深拷贝：

import copyoriginal = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]deep = copy.deepcopy(original)deep[0][0] = 999print(original[0][0])  # 1，不受影响

性能提示：deepcopy 开销较大，如果嵌套结构已知，手动构建拷贝往往更快。例如二维矩阵可以用 [row[:] for row in matrix]。

七、列表的高级操作

7.1 zip 与 unzip

names  = ['Alice', 'Bob', 'Charlie']scores = [85, 92, 78]grades = ['B', 'A', 'C']# zip：并行迭代多个列表combined = list(zip(names, scores, grades))print(combined)  # [('Alice', 85, 'B'), ...]# unzip：使用 * 解包unzipped_names, unzipped_scores, unzipped_grades = zip(*combined)# zip 在不等长列表中截断至最短，用 itertools.zip_longest 保留全部from itertools import zip_longestresult = list(zip_longest([1, 2, 3], [4, 5], fillvalue=0))# [(1, 4), (2, 5), (3, 0)]

7.2 enumerate 与索引配对

fruits = ['apple', 'banana', 'cherry']# 传统方式（不推荐）for i in range(len(fruits)):    print(i, fruits[i])# ✅ Pythonic 方式for i, fruit in enumerate(fruits, start=1):  # start 指定起始值    print(i, fruit)

7.3 列表的解包操作

Python 3 的扩展解包（Extended Unpacking）是处理列表的利器：

first, *rest = [1, 2, 3, 4, 5]print(first)  # 1print(rest)   # [2, 3, 4, 5]*init, last = [1, 2, 3, 4, 5]print(last)   # 5first, *middle, last = [1, 2, 3, 4, 5]print(middle)  # [2, 3, 4]# 函数调用中的解包defadd(a, b, c):return a + b + cargs = [1, 2, 3]print(add(*args))  # 6

7.4 flatten 扁平化

# 一维展开nested = [[1, 2], [3, 4], [5, 6]]flat = [x for sublist in nested for x in sublist]# 使用 itertools.chainfrom itertools import chainflat2 = list(chain.from_iterable(nested))# 递归展开任意深度嵌套defdeep_flatten(lst):for item in lst:if isinstance(item, list):yieldfrom deep_flatten(item)else:yield itemdeep = [1, [2, [3, [4, [5]]]]]print(list(deep_flatten(deep)))  # [1, 2, 3, 4, 5]

7.5 去重与保序去重

lst = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3]# 去重但不保序（通过 set）unique = list(set(lst))# ✅ 去重且保序（Python 3.7+ dict 有序）unique_ordered = list(dict.fromkeys(lst))print(unique_ordered)  # [3, 1, 4, 5, 9, 2, 6]# 通用保序去重（适合不可哈希元素）defordered_unique(lst):    seen = set()return [x for x in lst ifnot (x in seen or seen.add(x))]

7.6 分组与分块

from itertools import islicedefchunk(lst, size):"""将列表分成固定大小的块"""    it = iter(lst)return iter(lambda: list(islice(it, size)), [])data = list(range(10))for batch in chunk(data, 3):    print(batch)# [0, 1, 2], [3, 4, 5], [6, 7, 8], [9]# 简洁版（推导式）defchunk_simple(lst, n):return [lst[i:i+n] for i in range(0, len(lst), n)]

八、列表与其他数据结构的对比与选型

8.1 list vs tuple

import syslst   = [1, 2, 3, 4, 5]tpl   = (1, 2, 3, 4, 5)# tuple 占用内存更少print(sys.getsizeof(lst))  # 104 bytesprint(sys.getsizeof(tpl))  # 80 bytes# tuple 创建速度更快（常量折叠优化）import timeitprint(timeit.timeit('(1,2,3,4,5)', number=10**7))   # 更快print(timeit.timeit('[1,2,3,4,5]', number=10**7))   # 更慢

选型原则：数据不需要修改时优先用 tuple；需要频繁修改、排序、追加时用 list。

8.2 list vs deque（头部操作场景）

from collections import dequeimport timeitn = 10000# list 头部插入：O(n)list_insert = timeit.timeit('lst.insert(0, 0)', setup='lst = list(range(10000))', number=n)# deque 头部插入：O(1)deque_insert = timeit.timeit('dq.appendleft(0)', setup='from collections import deque; dq = deque(range(10000))', number=n)print(f"list.insert(0): {list_insert:.4f}s")print(f"deque.appendleft: {deque_insert:.4f}s")# deque 约快 10-50 倍（取决于 n）

8.3 list vs set（成员查找场景）

import timeitlst = list(range(10000))st  = set(range(10000))list_search = timeit.timeit('9999 in lst', globals=globals(), number=100000)set_search  = timeit.timeit('9999 in st',  globals=globals(), number=100000)print(f"list 查找: {list_search:.4f}s")print(f"set 查找:  {set_search:.4f}s")# set 查找通常快 100-1000 倍

九、列表的常见陷阱与最佳实践

9.1 函数默认参数的可变陷阱

# ⚠️ 经典陷阱：可变默认参数defappend_to(element, to=[]):    to.append(element)return toprint(append_to(1))  # [1]print(append_to(2))  # [1, 2]  ← 不是 [2]！默认参数只创建一次# ✅ 正确做法defappend_to_safe(element, to=None):if to isNone:        to = []    to.append(element)return to

9.2 列表比较与身份判断

a = [1, 2, 3]b = [1, 2, 3]c = aprint(a == b)   # True，值相等print(a is b)   # False，不同对象print(a is c)   # True，同一对象# id() 查看内存地址print(id(a), id(b), id(c))

9.3 大规模数据的性能优化

# 提前分配空间（当大小已知时）n = 100000lst = [None] * n      # 比逐步 append 更快for i in range(n):    lst[i] = i * 2# 使用局部变量缓存方法引用（在紧密循环中有效）deffast_append():    lst = []    append = lst.append   # 缓存方法引用，减少属性查找for i in range(10000):        append(i)return lst# 当数据量超过百万，考虑使用 array 模块或 numpyimport arrayint_array = array.array('i', range(1000000))  # 内存是 list 的 1/4

9.4 列表推导式的边界

# 推导式适合：简单转换与过滤# 不适合：有副作用的操作、超过两层嵌套（可读性下降）# ⚠️ 滥用：难以阅读result = [func(x) for x in [transform(y) for y in data if condition(y)] if validate(x)]# ✅ 拆分为多步，可读性更强filtered = [transform(y) for y in data if condition(y)]result   = [func(x) for x in filtered if validate(x)]

十、标准库中操作列表的工具函数

10.1 内置函数

lst = [3, 1, 4, 1, 5, 9, 2, 6]print(len(lst))       # 8print(max(lst))       # 9print(min(lst))       # 1print(sum(lst))       # 31print(any(x > 8for x in lst))   # Trueprint(all(x > 0for x in lst))   # True# map 和 filter 返回惰性迭代器doubled  = list(map(lambda x: x * 2, lst))positive = list(filter(lambda x: x > 3, lst))# 更 Pythonic 的写法doubled  = [x * 2for x in lst]positive = [x for x in lst if x > 3]

10.2 functools.reduce

from functools import reducelst = [1, 2, 3, 4, 5]product    = reduce(lambda x, y: x * y, lst)         # 120running_max = reduce(lambda acc, x: acc + [max(acc[-1], x)], lst[1:], [lst[0]])

10.3 更多 itertools 工具

from itertools import accumulate, compress, takewhile, dropwhileimport operatorlst = [1, 2, 3, 4, 5]# 累积计算print(list(accumulate(lst)))                          # [1, 3, 6, 10, 15]print(list(accumulate(lst, operator.mul)))            # [1, 2, 6, 24, 120]# 按布尔掩码过滤mask = [1, 0, 1, 0, 1]print(list(compress(lst, mask)))                      # [1, 3, 5]# 取满足条件的前缀/后缀print(list(takewhile(lambda x: x < 4, lst)))          # [1, 2, 3]print(list(dropwhile(lambda x: x < 4, lst)))          # [4, 5]

结语

真正掌握列表，意味着你在面对问题时能够本能地判断：这个场景用列表合适吗？用哪种操作最高效？有没有更 Pythonic 的写法？

本文来自网友投稿或网络内容，如有侵犯您的权益请联系我们删除，联系邮箱：wyl860211@qq.com 。