pd.cut怎么用?

  统计/机器学习 Python    浏览次数:2165        分享
0

pandas里pd.cut怎么用?

 

jacksun   2019-07-02 07:13



   2个回答 
4

官网上介绍的比较清楚了,并且在下面还有例子。

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.cut.html?highlight=cut#pandas.cut

简单的一句话pandas的cut可以把一组数据分割成离散的区间。

import numpy as np
import pandas as pd
pd.cut(np.array([1, 7, 5, 4, 6, 3]), 3)
#output:
#[(0.994, 3.0], (5.0, 7.0], (3.0, 5.0], (3.0, 5.0], (5.0, 7.0], (0.994, 3.0]]
#返回的是每个元素所在的区间
SofaSofa数据科学社区DS面试题库 DS面经

NullErr   2019-07-08 15:54

2

pd.cut可以方便将连续数值离散化。

下面的例子就是利用pd.cut将成绩分数转成等第。

def score2grade(score):
    grade = pd.cut(score, [0, 60, 70, 80, 90, np.inf], right=False, labels=['F', 'D', 'C', 'B', 'A'])
    return grade

比如

score2grade([45, 65, 70, 92])

就会得到['F', 'D', 'C', 'A']

SofaSofa数据科学社区DS面试题库 DS面经

木子周   2019-07-10 15:10



  相关主题

pd.read_csv报错Error tokenizing data,如何跳过错误的行?   1回答

pandas DataFrame去掉重复的行   1回答

pandas报错ValueError: Cannot convert non-finite values (NA or inf) to integer   1回答

pandas读取文件夹中所有的csv文件   1回答

把pandas df写入csv时UnicodeEncodeError   1回答

pandas.DataFrame的index重新排列(从0开始)   2回答

将pandas DataFrame保存成本地txt并删去列名   1回答

怎么改变pandas dataframe里column的顺序?   1回答

pandas怎么按照groupby串联字符串?   2回答

怎么删除pandas数据框指定的第k行?   2回答

pandas数据合并 merge 相同的列能不能合并   2回答

pandas dataframe insert报错ValueError: unbounded slice   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!