怎么对时间序列类的数据进行聚类?

  统计/机器学习 无监督学习 时间序列 开放问题    浏览次数:376        分享
0

假设每个样本都有自己的一条时间序列曲线,怎么对时间序列类的数据进行聚类?

 

Raymond   2019-07-07 15:20



   2个回答 
5

使用传统K-Means等等都可以,问题的关键是如何定义距离。有两个东西可以给你参考:

1. Time Series Data Clustering,书籍Data Clustering: Algorithms and Applications的第15章,从学术的角度阐明各种不同时间序列聚类的方法;

2. 近几年刚刚提出的K-Shape算法:http://www1.cs.columbia.edu/~jopa/Papers/PaparrizosSIGMOD2015.pdf

SofaSofa数据科学社区DS面试题库 DS面经

moriarty0405   2019-09-11 16:04

2

要看你聚类的目的是什么了。简单一点的话,就每个样本提起出均值和方差,然后做两维的kmeans。

稍微复杂一点,就以每个时间点作为一个特征,比如每个样本都有相同起始终止点,一共有50个时间点,那么相当于每个样本都有50个特征,然后做50维的kmeans。

SofaSofa数据科学社区DS面试题库 DS面经

WinJ   2019-09-11 13:51



  相关主题

时序中的change point是什么意思?   1回答

有什么方法可以找到时间序列的周期?   3回答

python里有现成的卡尔曼滤波器的包吗?   2回答

python中有哪些关于隐马尔可夫模型(HMM)的package?   2回答

怎么判断一个时间序列是平稳的?   2回答

ARIMA模型中的三个参数(p, d, q)都是什么意思?   1回答

如何判断时间序列的周期性?   2回答

怎么对时间序列进行交叉验证?   1回答

求助,按照百度的方法从日期提取年龄出现错误了   1回答

怎么在python中获取昨天的日期的字符串?   1回答

python中怎么判断某一年是闰年?   2回答

python中如何修改时间戳变量里的小时?   1回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!