一个销售预测的case,简化下:
销售表:时间,月销售额; 购买者表:id,购买时间,属性A,属性B,属性C,属性D
假设购买者不同属性对销售额有影响,构造时间序列输入能否按不同属性维度分别count作为输入呢?
如var 1=count id when A=a1,
var 2 = count id when A=a2
var 3 = count id when A=a1,B=b1,C=c1
var 4 = count id when A=a1,B=b1,C=c2,
……
这样能得到没有不同属性组合下的每个月的购买者数作为输入,但属性很多的时候,变量过多,而且变量间有部分相关性,如何筛选有效的变量呢?还是说这样构造方法不对,有其他方式么?
有人有思路么?先谢谢啦
1个回答
可以试试先对消费者做聚类?把消费者分成k簇。
然后每个月的数据就是
销售额,1簇人数,2簇人数,...,k簇人数
对于销售额,你可以按照AR模型的方式来处理
销售额,上月销售额,上上月销售额,1簇人数,2簇人数,...,k簇人数
仅供参考!