读取excel框架时跳过特定的列集

我事先知道excel文件中不需要哪些列,我希望在读取文件时避免使用这些列以提高性能。大概是这样的:

将熊猫作为pd导入
df=pd.read_excel('large_excel_file.xlsx',skip_cols=['col_a','col_b',,…,'col_zz'])

文档中没有与此相关的内容。有什么解决办法吗

如果您的pandas版本允许(首先检查是否可以将函数传递给usecols),我会尝试以下方法:

将熊猫作为pd导入
df=pd.read\u excel('large\u excel\u file.xlsx',usecols=lambda x:'Unnamed'不在x中,)

这应该跳过所有没有标题名的列。您可以用不需要的列名列表替换“Unnamed”

发表评论