pandas中groupby用法详细说明是什么呢?不清楚的小伙伴们来看看我现在的分享吧!
在Pandas中,社交媒体行业将用户依据肖像(性別、年纪)开展细分化,科学研究用户的运用状况和喜好等关键应用groupby进行 。
Groupby的基本概念:
在pandas中,完成分类实际操作的代码非常简单,仅需一行代码,在这儿,将里面的数据依照company字段名开展区划:In [5]: group = data.groupby("company")
将以上代码键入ipython后,会获得一个DataFrameGroupBy目标
In [6]: group
Out[6]: <pandas.core.groupby.generic.DataFrameGroupBy object at 0x000002B7E2650240>
那这一转化成的DataFrameGroupBy是啥呢?对data开展了groupby后发生什么事?ipython所回到的結果是其内存地址,并不利形象化地了解,为了更好地看一下group内部结构到底是什么,这儿把group转化成list的类型看来:
In [8]: list(group)
Out[8]:
[('A', company salary age
3A20 22
6A23 33),
('B', company salary age
4B10 17
5B21 40
8B8 30),
('C', company salary age
0C43 35
1C17 25
【pandas groupby】 2C8 30
7C49 19)]
转化成目录的方式后,能够看见,目录由三个元组构成,每一个元组中,第一个原素是等级(这儿是依照company开展分类,因此最终分成了A,B,C),第二个原素的是相匹配等级下的DataFrame,整个过程可以详解如下所示:
汇总而言,groupby的历程便是将原来的DataFrame依照groupby的字段名(这儿是company),区划为多个分类DataFrame,被分成多少个组就有多少个分类DataFrame 。所以说,在groupby以后的一系列实际操作(如agg、apply等),均是根据子DataFrame的实际操作 。
以上便是我现在的共享了,期待可以作用到大伙儿 。
- pandas怎么使用? pandas教程
- pandas怎么读取excel文件呢? pandas读取excel文件
- 怎么样使用solr实现类似于数据库的groupby的统计功能?
- python list groupby itertools