matplotlib 是一个用于数据绘图的第三方 Python 库,它能够创建各种可视化图表。只需几行代码,就可以利用 matplotlib 生成图表。matplotlib 的子库 matplotlib.pyplot 提供了一系列绘图函数,每个函数都对应着一个特定操作。在绘图过程中,figure() 函数用于创建一个新的图形窗口,而 subplot() 函数用于在该窗口中创建子图。所有的绘图操作都在这些子图上进行。plt() 函数用于表示当前活跃的子图。
第6章 界面设计 tkinter 库
tkinter 是 Python 的标准 GUI(Graphical User Interface,图形用户界面)库,它提供了一套丰富的组件和控件,用于创建图形用户界面。作为 Python 的内置模块,tkinter(通过 Tk 接口)允许开发者构建窗口化的应用程序,无须额外安装或下载。
tkinter 的核心优势在于其简单性和易用性,特别适合初学者和快速原型开发。它提供了一系列的 GUI 组件,如按钮、文本框、标签、列表框、画布等,以及事件处理机制,使得开发者能够实现直观的用户交互功能。此外,tkinter 的跨平台特性意味着使用 tkinter 开发的应用程序可以在不同操作系统上运行,无须修改代码。
本章详细讲解了窗体、标签、文本框、命令按钮、单选按钮、复选框、列表框、滚动条、进度条、框架、消息框、菜单条的创建,以及形状控制、顶层设计和窗口布局等内容。
尽管 Python 生态系统中存在其他更高级的 GUI 库,如 PyQt、wxPython 和 Kivy 等,tkinter 仍然是一个灵活且功能完备的工具,尤其适用于需要快速开发具有基本 GUI 需求的应用程序。对于复杂的桌面应用程序,虽然 tkinter 可能不是最强大的选择,但它的易用性和 Python 的广泛社区支持使得它成为许多开发者的首选。
第7章 openpyxl库
openpyxl 是 Python 第三方库,可以读取和编写 .xlsx、.xlsm、.xltx 和 .xltm 文件。对于早期的 Excel 文档格式(.xls),需要用到其他第三方库(如 xlrd、xlwt 等)。openpyxl 不仅能够读取和修改 Excel 文档,还支持单元格格式设置、图片插入、表格编辑、公式输入、筛选、批注、文件保护和打印设置等多种功能。
openpyxl 可以处理数据量较大的 Excel 文件,其跨平台处理大量数据的能力是其他模块难以比拟的。因此,openpyxl 成为处理 Excel 复杂问题的首选第三方库。
openpyxl 中包含3个核心对象:Workbook(工作簿)、Worksheet(工作表)和 Cell(单元格)。它们之间的关系如下:一个工作簿由多个工作表组成;每个工作表又包含多个单元格;单元格可以通过行(row)和列(column)的坐标定位。
本章以工作簿对象、工作表对象、单元格对象及其样式为脉络,阐述相关概念及操作,并从整体上介绍使用 openpyxl 库操作 Excel 的各种方法与步骤,从而帮助读者建立起对 openpyxl 库的整体框架的理解。
本章所涉及的第三方库调用包括:
from openpyxl import Workbook # 用于创建工作簿
from openpyxl import load_workbook # 用于调用工作簿
from openpyxl.styles import Font # 用于设置字体格式
from openpyxl.styles import Border, Side # 用于设置边框样式
from openpyxl.styles import Alignment # 用于设置对齐方式
from openpyxl.styles import PatternFill # 用于设置背景颜色
openpyxl 是一个用于读写 Excel 2010 及更新版本文档的 Python 库,如果要处理更早期版本的 Excel 文档(如 Excel 2003),需要用到额外的库(如 xlrd 库和 xlwt 库)。尽管 openpyxl 对 Excel 2003 及更早版本文件的兼容性不好,但其提供了更强大的功能,可以轻松进行 Excel 数据的读取、写入和样式设置。它能够实现大量重复的 Excel 操作,提高办公效率,并实现 Excel 办公自动化。
第8章 Python数据预处理
在使用 Excel 工作表前,通常要求数据是完整的,即整行整列无空值、无多余空格且数据准确无误。然而,在实际工作中,由于各种各样的原因,源数据表绝大部分数据都达不到这个要求,因此需要对数据表进行预处理,以满足后续工作的基础要求。预处理本质上是对数据进行初加工,确保数据的质量和准确性,为进一步分析和处理打下坚实基础。
pandas 是一个开源的 Python 数据处理库,它提供了高效的数据结构和数据分析工具。在 pandas 中,可以使用 DataFrame 对象来操作表格类型的数据。DataFrame 对象是一个二维表格数据结构,允许每列保存不同类型的数据。
Python 辅以 pandas 库和 NumPy 库的支持,成为数据处理与分析的强大工具,尤其在数据预处理方面表现出色。
本章通过介绍 Series 对象和 DataFrame 对象的创建、DataFrame 对象数据的基本操作、数据增改、数据清洗、数据格式化、数据类型转换、数据排序、数据计算与统计、数据分组、日期时间序列的操作以及常用函数,讲解了如何利用 pandas 第三方库对数据进行预处理的各方面内容。
本章脱离了 Excel 数据表本身,以 DataFrame 对象为基础进行了讲解。Excel 数据是可以转化为 DataFrame 对象的,同样 DataFrame 对象也可以重新写入 Excel 文件中。
阅读感悟:
本书于 2025 年 5 月首次出版,介绍了基于 Python 的 Excel 文件处理技术栈,包括xlrd库和xlwt库(用于处理.xls文件)、xlwings库(用于处理.xlsx文件)、pandas库(数据处理)、matplotlib库(数据可视化)、tkinter库(视窗设计)和openpyxl库(excel文件读写操作)等。
在我的日常办公场景中,大多数常规数据处理任务可直接通过 Excel 功能完成;部分任务也可借助 AI 工具直接生成结果,无需手动编写 Python 代码。然而,在面对大规模数据处理、复杂业务逻辑时,如果Excel 操作效率受限,后续可考虑通过 AI 辅助生成 Python 脚本(如基于 pandas 或 openpyxl 的自动化程序),提升数据处理效率与可复用性。遗憾的是,本书未涉及 AI 辅助生成 Python 代码处理 Excel 数据的相关实践案例。