怎么对时间序列类的数据进行聚类?

  统计/机器学习 无监督学习 时间序列 开放问题    浏览次数:558        分享
0

假设每个样本都有自己的一条时间序列曲线,怎么对时间序列类的数据进行聚类?

 

Raymond   2019-07-07 15:20



   2个回答 
5

使用传统K-Means等等都可以,问题的关键是如何定义距离。有两个东西可以给你参考:

1. Time Series Data Clustering,书籍Data Clustering: Algorithms and Applications的第15章,从学术的角度阐明各种不同时间序列聚类的方法;

2. 近几年刚刚提出的K-Shape算法:http://www1.cs.columbia.edu/~jopa/Papers/PaparrizosSIGMOD2015.pdf

SofaSofa数据科学社区DS面试题库 DS面经

moriarty0405   2019-09-11 16:04

2

要看你聚类的目的是什么了。简单一点的话,就每个样本提起出均值和方差,然后做两维的kmeans。

稍微复杂一点,就以每个时间点作为一个特征,比如每个样本都有相同起始终止点,一共有50个时间点,那么相当于每个样本都有50个特征,然后做50维的kmeans。

SofaSofa数据科学社区DS面试题库 DS面经

WinJ   2019-09-11 13:51



  相关主题

时序中的change point是什么意思?   1回答

有什么方法可以找到时间序列的周期?   3回答

python中有哪些关于隐马尔可夫模型(HMM)的package?   2回答

python里有现成的卡尔曼滤波器的包吗?   2回答

怎么判断一个时间序列是平稳的?   2回答

ARIMA模型中的三个参数(p, d, q)都是什么意思?   1回答

怎么对时间序列进行交叉验证?   1回答

如何判断时间序列的周期性?   2回答

怎么把datetime类型转为字符串类型,但只保留日期   1回答

python如何对日期做遍历?有没有类似range的函数?   2回答

求助,按照百度的方法从日期提取年龄出现错误了   1回答

fbprophet.Prophet里的growth='linear'和growth='logistic'有什么区别?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!