全网整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:400-708-3566

Python如何从Excel处理数据_表格数据读取与清洗方法【教程】

Python处理Excel数据核心是用pandas.read_excel安全读取,再清洗分析;需注意日期解析、空值处理、合并单元格填充、多层表头识别及导出限制。

Python处理Excel数据,核心是用pandas读取、清洗和分析,关键在于选对工具、避开常见坑(比如日期错乱、空值误判、合并单元格崩溃)。

用pandas.read_excel安全读取表格

别直接用xlrd或openpyxl手动解析——除非你要改样式。95%场景下,pandas.read_excel()够用且稳定。

  • 指定sheet_name:支持字符串(表名)、整数(第几个表,从0开始)或列表(多表一起读)
  • 跳过无效行:skiprows=2跳过前两行;skipfooter=1(旧版pandas)或用usecols限定列范围更可靠
  • 处理日期:加parse_dates=['订单日期'],避免读成字符串;若自动识别失败,用date_parser自定义格式,如pd.to_datetime(df['日期'], format='%Y/%m/%d')
  • 合并单元格?pandas会自动填充为NaN或重复值,读完立刻用df.fillna(method='ffill')向下填充(按列)

快速识别并清理脏数据

读进来先看df.info()df.head(),重点盯三类问题:

  • 空值:用df.isnull().sum()查每列空值数;删除整行用df.dropna(how='all')(全空才删),填充用df['销量'].fillna(df['销量'].median(), inplace=True)
  • 异常值:数值列用df.describe()看min/max是否离谱;结合箱线图或df[(df['价格'] > df['价格'].quantile(0.99))]定位极值,再判断是删还是修正
  • 格式混乱:如“¥1,234.50”这种带符号和逗号的文本型数字,用df['金额'] = df['金额'].str.replace(r'[¥,]', '').astype(float)

处理常见结构难题

真实Excel常有标题不齐、多级表头、备注行混入——不能靠肉眼调。

  • 多层表头:用header=[0,1]读取前两行为列索引,之后用df.columns.get_level_values(0)df.xs('销售额', axis=1, level=0)取某一层
  • 标题在中间?先用df = pd.read_excel(file, header=None)全当纯数据读,再用df.iloc[5]找标题行,然后df.columns = df.iloc[5]; df = df.iloc[6:].reset_index(drop=True)
  • 一列含多信息(如“张三-北京-男”):用df[['姓名','城市','性别']] = df['原始列'].str.split('-', expand=True)

保存结果不丢格式(基础需求)

清洗完要保存回Excel,df.to_excel()默认不带索引,但注意:

  • index=False避免多出一列序号
  • 若需保留公式或图表——pandas做不到,改用openpyxl加载后写入数值:wb = load_workbook('原表.xlsx'); ws = wb['Sheet1']; ws['B2'] = df.iloc[0,1]; wb.save('新表.xlsx')
  • 导出多个表到一个文件:with pd.ExcelWriter('汇总.xlsx') as writer: df1.to_excel(writer, sheet_name='清洗后'); df2.to_excel(writer, sheet_name='统计')

基本上就这些。不用追求一步到位,先读稳、再查清、后动刀——大部分Excel清洗,三步循环搞定。


# excel  # python  # 工具 


相关文章: 宝塔面板如何快速创建新站点?  网站制作的软件有哪些,制作微信公众号除了秀米还有哪些比较好用的平台?  交易网站制作流程,我想开通一个网站,注册一个交易网址,需要那些手续?  招贴海报怎么做,什么是海报招贴?  制作门户网站的参考文献在哪,小说网站怎么建立?  如何快速搭建个人网站并优化SEO?  高端建站如何打造兼具美学与转化的品牌官网?  jQuery 常见小例汇总  公司网站设计制作厂家,怎么创建自己的一个网站?  如何在阿里云域名上完成建站全流程?  如何在云指建站中生成FTP站点?  建站主机选择指南:服务器配置与SEO优化实战技巧  上海网站制作开发公司,上海买房比较好的网站有哪些?  建站DNS解析失败?如何正确配置域名服务器?  英语简历制作免费网站推荐,如何将简历翻译成英文?  如何快速完成中国万网建站详细流程?  网站规划与制作是什么,电子商务网站系统规划的内容及步骤是什么?  建站之星如何快速生成多端适配网站?  网站制作费用多少钱,一个网站的运营,需要哪些费用?  建站主机如何选?高性价比方案全解析  独立制作一个网站多少钱,建立网站需要花多少钱?  阿里云高弹*务器配置方案|支持分布式架构与多节点部署  如何在阿里云购买域名并搭建网站?  C++中引用和指针有什么区别?(代码说明)  天津个人网站制作公司,天津网约车驾驶员从业资格证官网?  济南企业网站制作公司,济南社保单位网上缴费步骤?  网站制作壁纸教程视频,电脑壁纸网站?  C++如何使用std::optional?(处理可选值)  高端企业智能建站程序:SEO优化与响应式模板定制开发  北京专业网站制作设计师招聘,北京白云观官方网站?  网站制作知乎推荐,想做自己的网站用什么工具比较好?  建站主机选虚拟主机还是云服务器更好?  网站制作新手教程,新手建设一个网站需要注意些什么?  ,想在网上投简历,哪几个网站比较好?  存储型VPS适合搭建中小型网站吗?  购物网站制作公司有哪些,哪个购物网站比较好?  小捣蛋自助建站系统:数据分析与安全设置双核驱动网站优化  制作网站的软件免费下载,免费制作app哪个平台好?  智能起名网站制作软件有哪些,制作logo的软件?  高性能网站服务器配置指南:安全稳定与高效建站核心方案  php8.4新语法match怎么用_php8.4match表达式替代switch【方法】  专业网站建设制作报价,网页设计制作要考什么证?  建站之星备案流程有哪些注意事项?  湖南网站制作公司,湖南上善若水科技有限公司做什么的?  如何用美橙互联一键搭建多站合一网站?  建站之家VIP精选网站模板与SEO优化教程整合指南  如何用搬瓦工VPS快速搭建个人网站?  网站建设设计制作营销公司南阳,如何策划设计和建设网站?  如何快速生成高效建站系统源代码?  潮流网站制作头像软件下载,适合母子的网名有哪些? 

您的项目需求

*请认真填写需求信息,我们会在24小时内与您取得联系。