pd.cut怎么用?

  统计/机器学习 Python    浏览次数:167        分享
0

pandas里pd.cut怎么用?

 

jacksun   2019-07-02 07:13



   2个回答 
2

官网上介绍的比较清楚了,并且在下面还有例子。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.cut.html?highlight=cut#pandas.cut

简单的一句话pandas的cut可以把一组数据分割成离散的区间。

import numpy as np
import pandas as pd
pd.cut(np.array([1, 7, 5, 4, 6, 3]), 3)
#output:
#[(0.994, 3.0], (5.0, 7.0], (3.0, 5.0], (3.0, 5.0], (5.0, 7.0], (0.994, 3.0]]
#返回的是每个元素所在的区间
SofaSofa数据科学社区DS面试题库 DS面经

NullErr   2019-07-08 15:54

1

pd.cut可以方便将连续数值离散化。

下面的例子就是利用pd.cut将成绩分数转成等第。

def score2grade(score):
    grade = pd.cut(score, [0, 60, 70, 80, 90, np.inf], right=False, labels=['F', 'D', 'C', 'B', 'A'])
    return grade

比如

score2grade([45, 65, 70, 92])

就会得到['F', 'D', 'C', 'A']

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-07-10 15:10



  相关主题

pandas读取csv中指定的某些列   2回答

如何重命名pandas的dataframe的列名   2回答

pandas按照两列sort_values,一个升序一个降序   1回答

怎么把一个pandas数据框用append的方式添加到现有的csv文件?   2回答

如何复制一个pandas DataFrame   1回答

pandas同时返回一个dataframe的前几行(head)和后几行(tail)   2回答

怎么利用pandas获得一个列联表(contingency table)?   1回答

pandas读取文件夹中所有的csv文件   1回答

如何对pandas dataframe的行做循环?   3回答

把pandas df写入csv时UnicodeEncodeError   1回答

怎么改变pandas dataframe里column的顺序?   1回答

pandas DataFrame去掉重复的行   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!