大家好,我是一个python零基础小白,今后会将自己用python学习的心得分享在这上面,加油鸭!
前言
我本是一位java工程师,最近不知经理受何人蛊惑,突然想到将各类excel的格式进行统一批量处理,于是我便踏上了漫长的python学习之旅~q~a~q
基本环境配置
版本:Python3
系统:Windows
相关模块:openpyxl、pandas
开发工具:Pycharm
在这里我使用的是 openpyxl,众所周知,java是最好的语言(不带针对性,各位看官切记莫急眼!),但是在对于excel、word等数据操作而言,还是微有不足之处的。
分析需求
最近突然接到一个任务,将多个工作表下的多个工作簿进行合并,此时便难到我了,于是通过某度查找到,可以通过python的OS库进行操作,通过学习后,了解到os.path.isfile(path) and os.path.splitext(path)[1] in (‘.xlsx’, ‘.xls’)可以用来判断绝对路径下的文件到底是单个文件还是装着多个excel表的文件夹,
然后通过下述代码对获取到的多个excel表进行合并:
# 获取 Excel 文件的文件名和工作表名称列表
excel_file = pd.ExcelFile(path)
sheet_names = excel_file.sheet_names
# 遍历所有工作表,读取数据并合并成一个 DataFrame
merged_df = pd.concat(pd.read_excel(excel_file, sheet_name=sheet_name) for sheet_name in sheet_names)
最终将合并值后的数据merged_df通过.to_excel导出,就完成了!
谢谢大家💇🙆