Python 操作 Excel：Openpyxl 全攻略｜从入门到实战的完整教程-猿码集

在数据处理和自动化办公场景中，Python 操作 Excel 已成为开发者的高效技能。本篇以 Openpyxl 为核心，呈现一份从入门到实战的完整教程，帮助你快速掌握Excel的读写、样式、以及与数据处理的集成能力。

如果你希望用编程方式高效地生成报表、清洗数据或实现定期自动化任务，Openpyxl 全攻略将覆盖从环境搭建到复杂应用的各个环节，确保你可以在实际项目中直接落地执行。

1. 基本概念与环境搭建

在正式使用前，需要建立对工作簿（Workbook）、工作表（Worksheet）、以及单元格（Cell）的直观理解，才能更高效地操作 Excel 文件。

理解核心对象后，第一步是准备运行环境，确保你在一个独立的 虚拟环境 中安装 openpyxl，以避免与其他库产生冲突。

1.1 安装 Openpyxl

在命令行中通过简单命令安装即可获得最新稳定版本的 Openpyxl，安装后就可以开始进行 Excel 自动化操作。

pip install openpyxl

安装完成后，你可以通过简单的导入来验证环境是否正常：import openpyxl，若未抛出异常则代表环境就绪。

1.2 认识核心对象：Workbook、Worksheet、Cell

打开一个工作簿时，Workbook 表示一个 Excel 文件，Worksheet 是文件中的单个工作表，而 Cell 则是具体的数据单元格。

一个简单的示例可以帮助你快速理解它们之间的关系：创建一个新的 Workbook，使用 active 获取默认工作表，并向单元格写入数据，最后保存为文件。

from openpyxl import Workbookwb = Workbook()
ws = wb.active
ws.title = "数据示例"
ws["A1"] = "名称"
ws["B1"] = "分数"
ws["A2"] = "张三"
ws["B2"] = 88
wb.save("example_basic.xlsx")

2. 快速上手：创建、写入、保存

掌握创建、写入、保存的基本流程后，你就具备了最核心的 Excel 自动化能力。通过一些直观的操作，可以快速把数据从程序端输出到 Excel。

在实际应用中，常需要对工作表进行命名、写入多行多列数据，以及注意文件覆盖与路径管理等问题，这些都是后续章节的基础。

2.1 新建工作簿与写入数据

创建一个工作簿并向工作表写入多行数据，是最常见的场景之一。你可以通过直接给单元格赋值来实现简单的表格生成。

from openpyxl import Workbookwb = Workbook()
ws = wb.active
ws.title = "学生表"
ws.append(["姓名", "科目", "成绩"])
ws.append(["李雷", "数学", 95])
ws.append(["韩梅梅", "英语", 88])
wb.save("students.xlsx")

append 方法是快速追加一整行数据的常用方式，能够显著简化多行写入的代码量。

2.2 写入公式与合并单元格

Openpyxl 能够保存 Excel 公式，写入公式后在 Excel 打开时会由工作簿自动计算结果。你也可以使用单元格合并来实现跨列标题等视觉效果。

ws["C2"] = "=SUM(B2:B10)"          # 公式示例
ws.merge_cells("D2:F2")                    # 合并单元格
wb.save("students_with_formulas.xlsx")

请注意，公式的计算结果通常在打开 Excel 时由 Excel 端计算，Openpyxl 仅负责保存公式表达式及单元格结构信息。

2.3 保存文件与覆盖策略

保存路径需要慎重设计，避免覆盖重要文件。wb.save 会将当前工作簿写入指定路径，若目标文件已存在则覆盖。

# 指定完整路径保存
wb.save("/path/to/reports/students_report.xlsx")

建议使用版本化的文件名（如日期或版本号）以便追踪变更历史。

3. 读取与遍历数据

从现有的 Excel 文件中读取数据，是数据清洗、分析和报表自动化的关键步骤。Openpyxl 提供了多种读取方式，适合不同规模的文件。

读取时可以选择逐行遍历、或一次性将数据加载为值（values），以适应不同的内存和性能需求。

3.1 读取单元格与遍历行列

通过 load_workbook 可以加载现有的 Excel 文件，data_only 参数用于返回公式计算结果（前提是有缓存值），对数据提取很有帮助。

from openpyxl import load_workbookwb = load_workbook("students.xlsx", data_only=True)
ws = wb.active# 读取第一行作为表头
headers = [cell.value for cell in ws[1]]# 遍历数据行，逐行提取值
for row in ws.iter_rows(min_row=2, values_only=True):print(row)

iter_rows 与 values_only 能显著降低内存开销，适合大数据场景。

3.2 处理日期与数字格式

在实际应用中，日期、时间和数字格式是常见的格式化需求。Openpyxl 提供了基本的格式支持，结合 value 获取原始数据，同时也可对单元格应用数字格式。

for row in ws.iter_rows(min_row=2, values_only=True):date_value = row[0]  # 假设第一列为日期amount = row[2]      # 第三列为金额print(type(date_value), date_value, amount)

data_only 与 number_format 的结合使用，可以在读取阶段获得更一致的数值输出。

4. 样式与美化

美观的表格在报告与分享场景中很重要。通过 Openpyxl 的样式组件，可以设置字体、填充、边框、对齐等，从而提升 Excel 文件的可读性和专业度。

Python 操作 Excel：Openpyxl 全攻略｜从入门到实战的完整教程

样式并非强制，但在自动化产出中，良好的视觉效果有助于信息传达。这里演示常见的样式配置方式。

4.1 设置字体、填充、边框

通过 Font、PatternFill、Border 等样式对象，可以实现文本加粗、背景填充、边框等多种效果。

from openpyxl.styles import Font, PatternFill, Border, Sidews["A1"].font = Font(bold=True, color="FFFFFF")
ws["A1"].fill = PatternFill(start_color="4F81BD", fill_type="solid")
thin = Side(border_style="thin", color="000000")
ws["A1"].border = Border(left=thin, right=thin, top=thin, bottom=thin)

细节设计 通过组合不同的样式，可以实现标题居中、内容单元格对齐等多种视觉效果。

4.2 单元格对齐与样式组合

除了字体与填充，对齐设置也是常见需求。使用 Alignment 可以实现水平与垂直对齐。

from openpyxl.styles import Alignmentws["A1"].alignment = Alignment(horizontal="center", vertical="center")

组合应用 将对齐、字体、填充组合在整张表格的标题行或汇总行中，提升可读性。

5. 实战技巧：与 Excel 文件清洗集成

将 Excel 的数据清洗、聚合等操作嵌入到工作流中，是 Openpyxl 的强大场景之一。以下技巧有助于提高稳定性与性能。

在实际项目中，合理使用只读模式、缓存策略以及与其他数据处理库的协同，能够让你更高效地处理大规模 Excel 文件。

5.1 处理大规模数据的性能要点

对于超大文件，推荐使用只读模式（read_only=True）以降低内存占用，并结合 iter_rows 提取需要的数据。

from openpyxl import load_workbookwb = load_workbook("large.xlsx", read_only=True, data_only=True)
ws = wb.activefor row in ws.iter_rows(min_row=2, values_only=True):process(row)  # 替换为你的数据处理逻辑

只读模式 可以显著降低内存压力，尤其在 ETL/数据清洗场景中非常实用。

5.2 与 Pandas 的对接和数据导出

有时需要借助 Pandas 进行更灵活的数据分析与导出；你可以先用 Openpyxl 读取/写入，再把数据转换为 DataFrame 进行后续处理。

import pandas as pd
from openpyxl import load_workbookwb = load_workbook("data.xlsx", data_only=True)
ws = wb.active# 将工作表转换为 DataFrame
data = ws.values
cols = next(data)
df = pd.DataFrame(data, columns=cols)

数据桥接 的方式能让你在保持 Excel 文件原有结构的同时，利用 Pandas 的分析能力完成更复杂的处理。

6. 常见问题与错误排除

在实际使用中，遇到的问题往往来自文件锁定、版本兼容、数据格式等方面。了解常见错误的原因和对应的排错策略，可以让你的自动化流程更稳定。

掌握基础诊断后，你就能快速定位问题并进行修复，而不必在每次出现异常时重新编写大段代码。

6.1 文件锁与版本兼容

如果 Excel 文件正在被另一应用程序使用，wb.save 可能会失败并抛出异常。确保在写入前关闭 Excel，并在代码中处理可能的 I/O 异常。

try:wb.save("reports/students_locked.xlsx")
except Exception as e:print("保存失败，请检查文件锁定状态与路径:", e)

版本差异 不同的 Openpyxl 与 Python 版本可能影响某些 API，建议在新项目中固定依赖版本并定期测试。

6.2 日期、公式与类型相关问题

处理日期时，注意单元格的实际数据类型，避免把日期文本误认为字符串。对于公式，确保在 Excel 打开时能够正确计算。

# 读取日期列时，尽量使用原始类型
for row in ws.iter_rows(min_row=2, values_only=True):date_value = row[0]if isinstance(date_value, str):# 如需转换，可以用 datetime 处理pass

数据一致性 是确保后续分析正确的关键，建议在写入和读取阶段都进行简单的类型校验。

6.3 Excel 旧版本兼容性与导出注意点

若需要与旧版 Excel 兼容（如 .xls 格式），Openpyxl 主要支持 xlsx 文件。若必须使用 xls，可以考虑先将数据导出为 xlsx，再在目标环境中进行转换或使用其他工具。

# 将数据导出为 xlsx，保持向后兼容性
wb = Workbook()
ws = wb.active
ws.append(["字段1", "字段2"])
wb.save("compatibility.xlsx")

文件格式选择 会直接影响你在生产环境中的部署和兼容性，务必在早期阶段就明确目标格式。