news 2026/5/8 16:18:53

Day 12:【99天精通Python】文件操作 - 让数据持久化保存

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Day 12:【99天精通Python】文件操作 - 让数据持久化保存

Day 12:【99天精通Python】文件操作 - 让数据持久化保存

前言

欢迎来到第12天!

在前面的11天里,我们写的所有程序,数据都保存在内存中。一旦程序运行结束或者电脑关机,那些辛苦计算出来的结果、用户输入的信息瞬间就消失了。

为了让数据能够长久保存(持久化),我们需要把数据写入到磁盘上的文件中。今天,我们将学习Python中的**文件I/O(输入/输出)**操作。学会了这一招,你就能做很多实用的事情了,比如写日志、处理Excel数据(CSV)、读取配置文件等。

本节内容:

  • 文件的打开与关闭
  • 最佳实践:with语句
  • 读取文件内容(全量读、按行读)
  • 写入文件内容(覆盖写、追加写)
  • 文件操作模式汇总
  • 实战练习

一、文件的基本操作流程

操作文件就像把大象装进冰箱,总共分三步:

  1. 打开文件(Open)
  2. 读写内容(Read/Write)
  3. 关闭文件(Close)

1.1 打开与关闭

使用内置函数open()打开文件,使用.close()方法关闭文件。

# 1. 打开文件 (如果文件不存在,读取模式下会报错)# encoding='utf-8' 非常重要,防止中文乱码f=open("test.txt",mode="w",encoding="utf-8")# 2. 写入内容f.write("Hello, World!\n")f.write("这是我的第一个文件。")# 3. 关闭文件 (必须做!否则可能导致数据丢失或资源占用)f.close()

1.2 为什么必须关闭文件?

如果不关闭文件:

  • 数据可能还在缓冲区,没真正写入磁盘。
  • 操作系统限制同时打开的文件数量,打开太多会报错。
  • 可能会导致文件被锁定,其他程序无法访问。

1.3 最佳实践:with 语句 (上下文管理器)

为了防止忘记写f.close(),或者程序在读写过程中出错导致无法关闭文件,Python 提供了with语句。

它会在代码块执行完毕后(无论是否报错),自动关闭文件。

# 推荐写法withopen("test.txt","w",encoding="utf-8")asf:f.write("使用with语句自动关闭文件,真香!")# 离开缩进块后,文件已自动关闭

二、读取文件

假设我们有一个data.txt,内容如下:

Python Java C++ Go

2.1 读取全部内容 read()

withopen("data.txt","r",encoding="utf-8")asf:content=f.read()print(content)

注意:如果文件非常大(比如几GB),不要用read(),否则内存会爆掉。

2.2 读取一行 readline()

每次只读一行,适合逐行处理。

withopen("data.txt","r",encoding="utf-8")asf:line1=f.readline()line2=f.readline()print(f"第一行:{line1.strip()}")# strip() 去除末尾换行符print(f"第二行:{line2.strip()}")

2.3 读取所有行 readlines()

读取所有行并返回一个列表

withopen("data.txt","r",encoding="utf-8")asf:lines=f.readlines()print(lines)# ['Python\n', 'Java\n', 'C++\n', 'Go']

2.4 最常用的遍历方式

直接对文件对象进行for循环,这是最省内存、最高效的方式。

withopen("data.txt","r",encoding="utf-8")asf:forlineinf:print(line.strip())

三、写入文件

写入主要有两种模式:覆盖 (w)追加 (a)

3.1 覆盖写入 (w - Write)

  • 如果文件不存在:创建新文件。
  • 如果文件已存在:清空原内容,重新写入。
withopen("output.txt","w",encoding="utf-8")asf:f.write("旧的内容被清空了。\n")f.write("这是新的内容。")

3.2 追加写入 (a - Append)

  • 如果文件不存在:创建新文件。
  • 如果文件已存在:在文件末尾添加内容,原内容保留。
withopen("output.txt","a",encoding="utf-8")asf:f.write("\n这是追加的一行。")

四、文件操作模式汇总

open(file, mode=...)中的mode参数决定了操作方式。

模式描述文件不存在时文件存在时
r只读(默认)报错读取
w只写创建新文件清空并覆盖
a追加创建新文件末尾追加
x独占创建创建新文件报错 (防止覆盖)
b二进制模式 (如图片、音频)--
+更新 (可读可写)--

常见组合

  • rb: 读取二进制文件 (图片)
  • wb: 写入二进制文件
  • r+: 读写模式 (文件指针在开头)
  • a+: 追加读写模式 (文件指针在末尾)

五、处理二进制文件 (图片/视频)

复制一张图片需要使用rb(Read Binary) 和wb(Write Binary) 模式。

# 文件复制工具defcopy_file(src,dst):try:withopen(src,"rb")asf_src:content=f_src.read()withopen(dst,"wb")asf_dst:f_dst.write(content)print("复制成功!")exceptFileNotFoundError:print("源文件不存在!")# copy_file("photo.jpg", "photo_backup.jpg")

六、实战练习

练习1:简易日记本

编写一个程序,让用户输入内容,保存到diary.txt中。每次运行程序都能追加新日记,并自动记录时间。

importdatetimedefwrite_diary():now=datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")print("请输入日记内容 (输入 'q' 退出):")content=input("> ")ifcontent.lower()=='q':return# 使用追加模式 'a'withopen("diary.txt","a",encoding="utf-8")asf:f.write(f"[{now}]{content}\n")print("日记已保存!")# 运行write_diary()

练习2:给代码加行号

读取一个 Python 文件,给每一行前面加上行号,并保存为新文件。

defadd_line_numbers(input_file,output_file):try:withopen(input_file,"r",encoding="utf-8")asf_in:lines=f_in.readlines()withopen(output_file,"w",encoding="utf-8")asf_out:forindex,lineinenumerate(lines,1):# 格式化:行号占4位,右对齐f_out.write(f"{index:>4}|{line}")print(f"处理完成,已保存至{output_file}")exceptFileNotFoundError:print("文件未找到!")# 假设当前目录下有 test.py# add_line_numbers("test.py", "test_numbered.txt")

七、常见问题

Q1:UnicodeDecodeError是什么鬼?

这是最常见的错误,通常是因为读取文件时编码格式不对。

  • Windows 默认编码可能是GBK
  • Linux/Mac 默认是UTF-8
  • 解决方法:在open()中始终显式指定encoding='utf-8'

Q2:路径中的反斜杠\报错?

在 Windows 路径中,\是转义字符(如\n,\t)。

  • 错误写法:open("C:\new\test.txt")(\n被当成换行了)
  • 正确写法1 (双反斜杠):"C:\\new\\test.txt"
  • 正确写法2 (原始字符串 r):r"C:\new\test.txt"
  • 正确写法3 (推荐,使用正斜杠):"C:/new/test.txt"(Windows也支持)

八、小结

文件操作 File I/O

打开 open()

模式 Mode

关闭 close()

'r' 只读 (默认)

'w' 覆盖写入

'a' 追加写入

'b' 二进制

f.close()

with open() as f (自动关闭 - 推荐)

读写方法

read() / write()

readline() / readlines()

for line in f (遍历)

关键要点

  1. 始终使用with open(...)来管理文件,安全又省心。
  2. 始终指定encoding='utf-8',远离乱码烦恼。
  3. 处理大文件时,使用for line in f逐行读取,不要一次性read()
  4. 区分w(清空写) 和a(追加写) 的区别。

九、课后作业

  1. 文件统计:下载或创建一个英文文本文件(如一篇新闻),统计其中共有多少行、多少个字符(不含空格)。
  2. 数据清洗:有一个scores.txt,每一行是一个学生成绩(如Tom:85)。请读取文件,计算平均分,并将不及格(<60)的学生名单写入fail_list.txt
  3. 批量修改:编写一个脚本,将当前目录下所有.txt文件内的 “Hello” 替换为 “Hi”。

下节预告

Day 13:模块与包 (Modules & Packages)- 代码写多了,全堆在一个文件里太乱了。明天我们学习如何像搭积木一样管理和组织代码!


系列导航

  • 上一篇:Day 11 - 函数进阶
  • 下一篇:Day 13 - 模块与包(待更新)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/1 21:46:27

工业环境下继电器模块电路图抗干扰设计指南

工业环境下继电器模块抗干扰设计实战指南&#xff1a;从原理到PCB落地在自动化产线的深夜&#xff0c;你是否经历过这样的场景&#xff1f;PLC控制柜里的继电器突然“啪”地一声自启动&#xff0c;电机毫无征兆地运转起来——而操作员根本没有下发指令。排查数小时后发现&#…

作者头像 李华
网站建设 2026/4/30 17:06:37

从零实现多层PCB生产流程:实验室级小批量制作方案

实验室里的“芯片工厂”&#xff1a;如何亲手做出一块四层PCB&#xff1f;你有没有过这样的经历&#xff1f;设计好了一块精密的四层板&#xff0c;满怀期待地发给厂家打样&#xff0c;结果等了五天&#xff0c;收货一看——线宽偏差、孔铜太薄、甚至内层错位。更糟的是&#x…

作者头像 李华
网站建设 2026/5/5 8:19:00

HBuilderX Windows环境配置:新手教程(零基础必看)

从零开始玩转 HBuilderX&#xff1a;Windows 下的前端开发第一站你是不是也曾在搜索“前端怎么入门”时&#xff0c;被一堆专业术语搞得晕头转向&#xff1f;Webpack、Babel、TypeScript、Node.js……光是名字就让人想放弃。其实&#xff0c;前端开发的第一步&#xff0c;完全可…

作者头像 李华
网站建设 2026/5/1 15:32:49

HBuilderX下载Windows版实战案例:适用于前端初学者

从零开始&#xff1a;手把手教你下载安装 HBuilderX&#xff08;Windows 版&#xff09;——前端新手的第一步 你是不是刚接触前端开发&#xff0c;面对五花八门的编辑器无从下手&#xff1f;VS Code 功能强大但配置复杂&#xff0c;Sublime Text 快速轻巧却要自己“拼装”插件…

作者头像 李华
网站建设 2026/5/1 7:34:51

基于FPGA的4位全加器设计与七段显示实战案例

FPGA实战入门&#xff1a;从全加器到七段数码管显示的完整数字系统构建你有没有想过&#xff0c;计算机最底层的“计算”到底是怎么发生的&#xff1f;两个数相加——这个在我们看来再简单不过的操作&#xff0c;其实背后藏着一套精密的逻辑体系。今天&#xff0c;我们就用一块…

作者头像 李华