读取excel框架时跳过特定的列集 – 开发百科-程序代码问答平台

我事先知道excel文件中不需要哪些列，我希望在读取文件时避免使用这些列以提高性能。大概是这样的：

将熊猫作为pd导入
df=pd.read_excel（'large_excel_file.xlsx'，skip_cols=['col_a'，'col_b'，，…，'col_zz']）

文档中没有与此相关的内容。有什么解决办法吗

如果您的pandas版本允许（首先检查是否可以将函数传递给usecols），我会尝试以下方法：

将熊猫作为pd导入
df=pd.read\u excel（'large\u excel\u file.xlsx'，usecols=lambda x:'Unnamed'不在x中，）

这应该跳过所有没有标题名的列。您可以用不需要的列名列表替换“Unnamed”