把分组频数统计的结果添加到原来dataframe中

  统计/机器学习 数据预处理 Python    浏览次数:403        分享
0

print(data.groupby(by=['ID'], as_index=False).count())

只能产生分组频数统计

----------------------

0 a

1 a

2 b

但是我期望结果是

0 a 2

1 a 2

2 b 1


这种如何解决

 

constant007   2020-02-16 11:50



   1个回答 
1

用transform,然后可以把结果作为新的一列count_ID插入到dataframe里

data['count_ID'] = data.groupby('ID')['ID'].transform('count')


SofaSofa数据科学社区DS面试题库 DS面经

zl_pku   2020-02-16 13:24



  相关主题

怎么求一个数组的移动平均数   1回答

一个数据预处理的问题   1回答

python中怎么把千位分隔符以及货币符号去掉转成数值形式?   1回答

python 读json 错误 ValueError: Unexpected character found when decoding array value (2)   0回答

str.replace为什么会将数字替换成NaN   1回答

怎么把dataframe的一列转成整数类型   2回答

让DataFrame中的行按照某一列元素的绝对值从大到小排列   1回答

怎麼將dataframe 欄位 對應到原有的csv檔 而寫入   1回答

数据白化是什么意思?   1回答

二值化和Onehot表示的特征哪一个较好?   1回答

机器学习中的维度灾难怎么防止和克服?   0回答

什么时候需要对y或者特征进行对数变换?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!