博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用python脚本将XML 电子表格转变为Excel
阅读量:5888 次
发布时间:2019-06-19

本文共 678 字,大约阅读时间需要 2 分钟。

hot3.png

在使用pandas批量处理Excel文件时,抛出XLRDError错误:XLRDError: Unsupported format, or corrupt file: Expected BOF record; found '<?xml ve'

错误缘于需要处理的excel文件不是真正的excel文件而是一个xml电子表格,针对这种文件可以使用lxml模块进行处理,也可以将此类型文件转换为Excel文件进行处理。

需要转换的文件有近2000个,使用手动的另存为效率太低,也不符合程序员的做法,遍寻解决方案,最终确定使用win32com模块可以解决这个问题,代码如下:

# -*- coding: utf-8 -*-

 

from win32com.client import Dispatch

import os

 

path_in = "H:\\error\\"

path_out="H:\\reSave\\"

 

xlApp=Dispatch("Excel.Application")

xlApp.Visible=0

n=0

for fn in os.listdir(path_in):

        n=n+1

        xlBook=xlApp.Workbooks.open(path_in+fn)

        out=path_out+fn

        print out

        xlBook.SaveAs(out,FileFormat=51)

        print n

        xlBook.Close(SaveChanges=0)

转载于:https://my.oschina.net/lCQ3FC3/blog/715115

你可能感兴趣的文章
读取FTP上的excel文件,并写入数据库
查看>>
vs2008快捷键极其技巧 转载
查看>>
window 7上安装Visual Studio 2017失败的解决方法
查看>>
JavaScript 正整数正则表达式
查看>>
单元测试之Stub和Mock
查看>>
【转】Java泛型-类型擦除
查看>>
PredictionIO+Universal Recommender快速开发部署推荐引擎的问题总结(2)
查看>>
【232】◀▶ IDL显示地理图像
查看>>
【116】Windows 系统组合键
查看>>
学习进度表 04
查看>>
python---__getattr__\__setattr_重载'.'操作
查看>>
谈谈javascript中的prototype与继承
查看>>
时序约束优先级_Vivado工程经验与各种时序约束技巧分享
查看>>
nginx win 启动关闭_windows下nginx启动与关闭的批处理脚本
查看>>
minio 并发数_MinIO 参数解析与限制
查看>>
eap wifi 证书_用openssl为EAP-TLS生成证书(CA证书,服务器证书,用户证书)
查看>>
mysql 应用程序是哪个文件夹_Mysql 数据库文件存储在哪个目录?
查看>>
mysql半同步和无损复制_MySQL半同步复制你可能没有注意的点
查看>>
mysql能看见表显示表不存在_遇到mysql数据表不存在的问题
查看>>
使用mysql实现宿舍管理_JSP+Struts2+JDBC+Mysql实现的校园宿舍管理系统
查看>>