我使用Pandas作为数据库的替代品,因为我有多个数据库(Oracle、SQL Server等),并且我无法对SQL等价物执行一系列命令
我在数据框中加载了一个表,其中包含一些列:
年月份、客户代码、大小等。
在SQL中,计算每年不同客户端的数量应为:
从表组中按年/月选择计数(不同的客户端代码);
结果是
201301 5000
201302 13245
我怎样才能在熊猫身上做到这一点
我相信这就是你想要的:
table.groupby('YEARMONTH').CLIENTCODE.nunique()
例如:
[2]on
:表
Output[2]:
客户代码年/月
0 1 201301
1 1 201301
2 2 201301
3 1 201302
4 2 201302
5 2 201302
6 3 201302
At[3]on:table.groupby('YEARMONTH').CLIENTCODE.nunique()
Output[3]:
年月
201301 2
201302 3