word2vec和GBDT模型能结合吗

  统计/机器学习 自然语言处理 推荐系统 开放问题    浏览次数:4681        分享
0

ctr预估,把用户的点击行为序列训练出词向量,能扔给 GBDT 跑吗?这样做是否有可解释性

 

dxiisjs   2018-08-03 16:36



   2个回答 
0

“点击行为序列训练出词向量”?

这个我不是很理解。是指点击的链接的文字内容吗?

题主可以试试,我觉得应该会对模型精度有帮助的,不过需要好好调参了可能。


SofaSofa数据科学社区DS面试题库 DS面经

sasa   2018-08-04 05:09

0

@sasa

做电商ctr预测,把用户点击过的商品gid按照时间排序,作为word2vec输入,输出每个商品的词向量,然后把用户点过商品的词向量平局,得到用户的词向量,输入给GBDT

现在训练完后,词向量的特征importance还是排在前面的,只是不知道改怎么解释

SofaSofa数据科学社区DS面试题库 DS面经

dxiisjs   2018-08-06 11:02

word embedding接近的说明用户过去的点击历史比较接近,点击历史对点击预测是很有帮助的。 - orz_k   2018-08-07 11:46


  相关讨论

word2vec怎么处理一词多义的情况?

如果不去除stop words,word2vec的结果会受到影响吗?

gensim的word2vec模型是skip-gram还是cbow?

教程中的利用Word2Vec判断是否是白话

gensim.models.word2vec模块的LineSentence有什么用?

gensim里word2vec的window指的是什么?包括的范围是多大?

怎么把训练好的bin格式的word2vec模型导入到gensim中使用?

为什么基于skip-gram的word2vec在低频词汇相比cbow更有效?

word2vec的网络里为什么没有bias偏置项

训练word2vec时移动窗口的大小怎么选择?

  随便看看

怎么在jupyter notebook里查看python的版本?

训练集中有的特征含有缺失值,一般怎么处理

二维numpy.array转为一维的numpy.array或者list

logloss的取值范围是多少?一般好的分类器能达到多少?

随机森林如何调参?