关于pairwise ranking数据预处理的问题

  统计/机器学习 推荐系统 数据预处理 开放问题    浏览次数: 172
0

我打算做一个pairwise的learning to rank,有数据,但是怎么做预处理呢?因为每个样本的feature都是同样格式的,所以如果直接使用的话,就是把两个数据合并起来,比如说

feature1_A    feature2_A    feature1_B    feature2_B    label


有什么好的预处理方法吗?

还有一个问题是,如果把A和B交换一下,那么label也就从1变成0或者从0变成1了。对于一个pair,我是产生两行数据(一个label是0,一个是1),还是就随机产生一条呢?

谢谢!


 

zzzz   2018-07-08 12:40



    还没有回答。我来答!  


  相关主题

协同过滤的数据预处理问题   4回答

推荐系统里的ALS是什么意思?   2回答

推荐系统中常用的表示相似或者距离的方法有哪些?   1回答

推荐系统算法里的cold start是什么意思?   2回答

余弦相似和内积的意义?   1回答

两个向量的余弦距离大于1?   1回答

Jaccard相似或者Jaccard距离是怎么计算的?   1回答

推荐系统中的召回(recall)是什么意思?   1回答

怎么理解推荐系统中的NDCG?   1回答

推荐系统有哪些常用的评价标准   3回答

余弦相似的定义是什么?怎么计算?   1回答

python里怎么计算jaccard相似   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!