序列是按顺序存储元素的集合,可以通过索引、切片获取其中的元素,是数据分析中处理多值数据的基础结构。
数据分析中常用序列类型有三种:
list:使用方括号[]定义,元素可修改,适合存储需动态更新的数据集;
tuple:使用圆括号()定义,元素不可修改,适合存储固定的配置或元数据;
str:使用引号定义,本质是字符序列,元素不可修改,用于处理文本类数据。
序列的核心操作包括:
索引:从 0 开始编号,通过方括号[索引值]获取单个元素;
切片:通过[start:end]获取一段元素,end位置不包含在结果中,支持负索引(-1表示最后一个元素);
通用函数:len()获取序列长度,in判断元素是否存在,二者在三种序列中均适用。
可变性是序列的重要属性:list为可变类型,可直接修改元素;tuple与str为不可变类型,修改操作需通过新建对象实现。
常见的序列错误主要是“索引越界”(触发IndexError)和修改不可变序列(触发TypeError)。排查时需先检查序列长度确认索引范围,再确认序列的可变性,对不可变序列的修改需通过新建对象完成。
#程序员成长之路 #Python #Python学习攻略 #程序员 #数据分析