phpexcle导出技巧_教你运用openpyxl库从Excel文件中提取指定的数据并生成新文件

文章目录 [+]

作者：Python进阶者

序言

前几天有个叫【Lcc】的粉丝在Python互换群里问了一道关于从Excel文件中提取指定的数据并天生新的文件的问题，初步一看确实有点难，不过还是有思路的。
她的目标便是想提取文件中A列单元格中数据为10的所有行，看到A列的表头是韶光，10就代表着上午的10小时，也便是说她须要提取每一天中的上午10点钟的数据。
这个数据在做研究的时候还是挺有用的，之后结合作图，就可以挖掘出部分潜在规律了，这个在此不做穷究。

phpexcle导出技巧_教你运用openpyxl库从Excel文件中提取指定的数据并生成新文件

（图片来自网络侵删）

一、思路

这个问题看似大略，直接用Excel中的筛选就可以了。
诚然，数据筛选，之后扩展行确实可以做到，针对一个或者两个或者10位数以下的Excel文件，我们尚且可以游刃有余，但是面对成百上千个这样的数据文件，怕就力不从心了，如果还是挨个进行处理，那就难熬痛苦了，以是用Python来批量处理还是很奈斯的。
下面一起来看看吧！

二、办理方法

# coding: utf-8from openpyxl import load_workbook, Workbook# 数据所在的文件夹目录path = 'C:/Users/pdcfi/Desktop/xiaoluo'# 打开数据事情簿workbook = load_workbook(path + '/' + '巍图1.xlsx')# 打开事情表sheet = workbook.activebuy_mount = sheet['A']row_lst = []for cell in buy_mount: if isinstance(cell.value, int) and cell.value == 10: print(cell.row) row_lst.append(cell.row)new_workbook = Workbook()new_sheet = new_workbook.active# 创建和原数据一样的表头（第一行）header = sheet[1]header_lst = []for cell in header: header_lst.append(cell.value)new_sheet.append(header_lst)# 从旧表中根据行号提取符合条件的行，并遍历单元格获取值，以列脸色势写入新表for row in row_lst: data_lst = [] for cell in sheet[row]: data_lst.append(cell.value) new_sheet.append(data_lst)# 末了牢记保存new_workbook.save(path + '/' + 'xiaoluo_符合筛选条件的新表.xlsx')

之后在本地查当作果，可以看到，符合条件的数据全部都被提取出来了。

2）把稳

还记得上图中粉丝说自己提取到的数据为啥只有header，而没有数据么？实在这里有个坑，隐蔽在她的原始数据中，请看下图。

A列的数据是从B列取的，是引用，所有等到访问的时候，实在是获取不到的，所有导致我们去读取的时候，查找的cell为空，自然我们就无法提取到数据。

针对这样的情形，这里给出两个方案，其一是将A列，复制粘贴，粘贴类型为"值"，然后重新保存excel进行读取就可以搞定了；其二因此B列作为索引，进行韶光取值，然后创建新的一列，之后再做提取，实现难度轻微大一些，取韶光的代码可以参考。

df_raw['韶光'] = pd.to_datetime(df_raw['韶光'], format='%Y-%m-%d').hour

本文用的是第一种方法，实在第二种方法显得更加智能一些，难度轻微大一些，实现方法大家可以踊跃的考试测验下。

三、总结

我是Python进阶者。
本文基于粉丝提问如何从Excel文件中提取指定的数据并天生新的文件的问题，给出了两种办理方案。

针对这个问题，

小伙伴们，快快用实践一下吧！