时序预测怎么做特征工程-SofaSofa

一个销售预测的case，简化下：

销售表：时间，月销售额；购买者表：id，购买时间，属性A，属性B，属性C，属性D

假设购买者不同属性对销售额有影响，构造时间序列输入能否按不同属性维度分别count作为输入呢？

如var 1=count id when A=a1,

var 2 = count id when A=a2

var 3 = count id when A=a1,B=b1,C=c1

var 4 = count id when A=a1,B=b1,C=c2,

……

这样能得到没有不同属性组合下的每个月的购买者数作为输入，但属性很多的时候，变量过多，而且变量间有部分相关性，如何筛选有效的变量呢？还是说这样构造方法不对，有其他方式么？

有人有思路么？先谢谢啦

lucian 2018-04-27 17:49

可以试试先对消费者做聚类？把消费者分成k簇。

然后每个月的数据就是

销售额，1簇人数，2簇人数，...，k簇人数

对于销售额，你可以按照AR模型的方式来处理

销售额，上月销售额，上上月销售额，1簇人数，2簇人数，...，k簇人数

仅供参考！

道画师 2018-04-27 20:49

时序预测怎么做特征工程