关注我:ღ双识求索ღ藏器于身,待时而动。
txt 的全称是 Text File(文本文件)。
它是一种纯文本格式的文件,仅包含字符数据,无二进制编码或复杂格式标记,可通过记事本、VS Code 等任意文本编辑器打开和编辑,是跨平台数据交换的基础格式之一。 ✅
1. 普通文本文件(.txt)
最典型的纯文本文件,无特殊格式标记,内容为 plain text。
2. 日志文件(.log)
程序或系统生成的记录文件,通常以纯文本形式存储事件、错误等信息(如error.log、access.log)。
3. 配置文件(.ini/.conf/.cfg)
用于存储程序配置参数的文本文件(如 Windows 系统的config.ini、Linux 的nginx.conf)。
4. 代码文件(.py/.js/.html/.css/.java 等)
所有编程语言的源代码文件均为纯文本格式,通过特定语法标记逻辑(如 Python 的.py、JavaScript 的.js)。
# 打开文件并读取第一行 with open("data.txt", "r", encoding="utf-8") as f: first_line = f.readline().strip() # 读取第一行,去掉首尾空格和换行符 # 分割第一行数据(按逗号) data_list = first_line.split(",") # 获取第1行第1列的数据(索引0) first_cell = data_list[0] print("第1行第1列的数据:", first_cell) # 输出:第1行第1列的数据
5. 结构化文本文件(.json/.xml/.yaml/.toml)
以文本形式存储结构化数据的文件:
6. 脚本文件(.bat/.sh/.cmd)
批处理或 shell 脚本文件,用于自动化执行命令(如 Windows 的.bat、Linux 的.sh)。
7. 标记语言文件(.md/.rst)
带格式标记的文本文件:
.md:Markdown 文件(如README.md);.rst:reStructuredText 文件(常用于文档生成)。
8. 其他分隔符文件(.tsv/.psv)
类似 CSV 的文本文件,用制表符(\t)或竖线(|)分隔列(如.tsv为制表符分隔)。
关键区分点
不属于 txt 文件的类型:二进制格式文件(如.docx、.xlsx、.png、.exe),这些文件包含非字符数据,无法通过纯文本编辑器正确解析。
纯文本文件的核心优势是跨平台兼容性强、体积小、易编辑,是数据交换和存储的基础格式之一。 ✅
CSV 的全称是 Comma-Separated Values(逗号分隔值)。
它是一种纯文本格式的表格数据交换标准,通过逗号分隔不同列的数据,每行代表一条记录,广泛用于 Excel、数据库、编程语言之间的结构化数据传输。 ✅
CSV(逗号分隔值)是一种轻量级表格数据交换格式,其特点可总结为以下几点:
1. 纯文本格式
- 由普通字符组成,无二进制数据,可用任何文本编辑器(如记事本、VS Code)打开和编辑。
2. 简单结构化
- 行
- 列:列之间用分隔符(默认逗号,也支持分号、制表符等)划分。
- (无论字段是否带逗号,用
csv模块都能正确处理:如果文件用 ** 制表符(\t)或分号(;)** 分隔,只需在csv.reader中指定delimiter参数:) - 索引规则:行、列索引均从
0 开始(与 Python 列表一致)。
import csvwith open("data.csv", "r", encoding="utf-8") as f: reader = csv.reader(f)# 处理TSV文件(制表符分隔)(f, delimiter="\t") rows = list(reader) # 转换为列表方便索引 target_value = rows[2][1] # 第3行第2列print(target_value)
3. 兼容性极强
- 支持几乎所有工具:Excel、Google Sheets、数据库(MySQL、PostgreSQL)、编程语言(Python、Java、R)等均可直接导入 / 导出。
- 跨平台:Windows、Mac、Linux 系统通用,无格式冲突。(分隔符划分列 + 行列索引从 0 开始,而
csv模块是 Python 中处理 CSV 文件最可靠的工具,能自动处理带引号的字段、不同分隔符等复杂场景。)
with open("data.csv", "r", encoding="utf-8") as f: # 或gbk,根据文件实际编码 reader = csv.reader(f)# 处理TSV文件(制表符分隔)csv.reader(f, delimiter="\t")
4. 体积小巧高效
- 无冗余格式信息(如字体、颜色、公式),文件大小远小于 Excel(
.xlsx)等二进制格式。
5. 灵活处理特殊字段
- 若字段包含分隔符(如
"北京,朝阳区")或换行符,可用引号(")包裹,避免解析错误。(此时不能直接用split(","),否则会错误分割。需使用 Python 内置的csv模块处理:) - 示例:
"姓名","年龄","地址","北京,朝阳区" → 正确识别为 4 列。
import csvwith open("data.txt", "r", encoding="utf-8") as f: reader = csv.reader(f) first_row = next(reader) # 获取第一行数据 first_col = first_row[0] # 第1列(索引0)print(first_col) # 输出带引号的字段(如"北京,朝阳区")
6. 局限性
- 不支持复杂格式:无法保存字体、颜色、单元格合并、公式、图片等。
- 依赖分隔符一致性:需确保所有行使用相同分隔符,否则易解析失败。
关键实践建议
- 用 Python 内置
csv 模块处理 CSV 文件,自动解决分隔符、引号等问题,避免手动分割错误。 - 若需处理复杂格式(如公式、图表),建议使用 Excel 或数据库格式,而非 CSV。
import csv# 获取第1行第1列的数据with open("data.txt", "r", encoding="utf-8") as f: reader = csv.reader(f) first_line = next(reader) # 读取第一行 first_column = first_line[0] # 取第一列(索引0)print("第1行第1列:", first_column)
CSV 是数据交换的 “通用语言”,简单、高效、跨平台是其核心优势! ✅
在这辽阔的世界,浩瀚的宇宙,其实每个人都是坐井观天,区别只是井口的大小而已,所以才有人谈格局,把格局打开就是希望你能够想象到井口以外的景象!多学习一些知识,我觉得是可以开阔眼界的一条捷径!
欢迎交流,有任何问题欢迎留言讨论
一起努力学习,解锁更多自动化数据分析技巧!
双识求索,在线充电,执着不倦,磨刀不止,藏器于身,待时而动。
数据分析可能大多数人都是从接触EXCEL开始的,非专业的程序员如果想要提高工作效率,学习一点VBA代码还是相当有帮助的!
如要让枯燥的数据分析带来灵动的活力就需要借助VBA代码进行自动化,使你的数据分析又快又好,助你高效制胜!
双识求索:VBA学习笔记,点点滴滴,刨根究底!关注我,体验跑通代码的快乐和数据分析成功的喜悦!
如果没有很多很多的钱,能有很多很多的爱也很好,能够利用VBA解决很多很多的问题也不错!