用户画像具体是指什么?

  统计/机器学习 开放问题    浏览次数:462        分享
2

在很多文章里以及面试里,都有“用户画像”这个概念,请教各位这个具体是指什么意思?包含哪些内容?

 

有为青年   2019-03-07 09:50



   3个回答 
7

用户画像——“User portrait”,即用户信息标签化,就是通过收集与分析消费者社会属性、生活习惯、消费行为等主要信息的数据之后,抽象出一个用户的商业全貌的基本方式。


什么是用户画像:

用户画像,又称人群画像,是根据用户人口统计学信息、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化画像。构建用户画像的核心工作即是给用户贴“标签”,而标签中部分是根据用户的行为数据直接得到,部分是通过一系列算法或规则挖掘得到。直接得到的数据比较好理解,比如用户在网站或APP上主动填写和上传的数据,严格一些平台(比如电商平台)会要求用户上传身份证、学生证、驾驶证、银行卡等,这样的数据准确性就较高,因此毫无疑问阿里和腾讯在用户基础数据的准确性上甩百度几条街。通过算法和数据挖掘得到的标签可以这么理解:如果一个用户最近开始购买母婴类商品(比如一段的奶粉,New Baby的纸尿布),那么可以根据用户购买的频次及数量,结合用户的年龄、性别推断是否为新妈妈/爸爸。


BAT用户画像数据浅析:

百度: 百度数据类型广泛,主要包含搜索数据、百度知道、百度贴吧及百度地图等数据,但是这些数据很少可以精确到个体用户层面,搜索大数据可以预测流行病爆发时间、世界杯的胜负概率及城市拥堵状况,总之百度的数据在宏观层面有不少应用,但是在微观的用户画像层面,百度毫无优势,大部分人还没有百度账号呢,百度的用户体系最近几年也是靠一些APP慢慢完善起来的。

腾讯: 腾讯的数据优势在社交数据,此外随着微信/QQ支付的普及,腾讯也有了用户身份证、银行卡等数据。腾讯的数据积累年限久远、维度丰富,从QQ、Qzone、腾讯微博到微信,腾讯涵盖兴趣偏好、地理位置、人口统计学信息等等数据,且准确性也不低。 腾讯在用户画像数据方面有很广泛的维度,且在兴趣、心理特征等标签上有很高的准确性。

阿里:据统计,2015年阿里巴巴活跃用户数为4.07亿,覆盖98.5%的中国互联网购物人群。其中,移动月度活跃用户达到3.93亿,占整个中国手机网民的64%,这意味着六成以上的中国手机网民都是淘宝或天猫移动端的活跃用户。(以上相关数据摘自“阿里妈妈电商营销”微信公众号) 目前阿里的数据标签已经逐步整理到阿里的数据超市——GProfile全局档案。GProfile 全局档案是以消费者档案为核心构建内容,通过分析消费者的基础信息、购物行为以描绘其特征画像。在阿里数据的平台上,GProfile 主要根据用户在历史时间内的网购行为记录,从网购时间点、内容深度剖析,提供用户基础属性、社交行为、互动行为、消费行为、偏好习惯、财富属性、信用属性和地理属性八大类标签服务。此外,从数据能力来说,阿里的数据还可结合优酷土豆视频数据、CNZZ友盟媒体数据、虾米天天动听音乐数据等。(以上相关内容摘自“阿里数据”微信公众号) 阿里数据的特点是真实、可靠,随着公司收购其他数据类平台,阿里的数据类型也逐渐丰富起来,在用户画像数据方面,阿里可谓彻彻底底的真人数据。

用户画像的价值:

1:精准营销。精准营销是用户画像或者标签最直接和有价值的应用。这部分也是我们广告部门最注重的工作内容。当我们给各个用户打上各种“标签”之后,广告主(店铺、商家)就可以通过我们的标签圈定他们想要触达的用户,进行精准的广告投放。无论是阿里、还是腾讯很大一部分广告都是通过这种方式来触达用户,百度的搜索广告方式有所不同。

2:助力产品。一个产品想要得到广泛的应用,受众分析必不可少。产品经理需要懂用户,除了需要知道用户与产品交互时点击率、跳失率、停留时间等行为之外,用户画像能帮助产品经理透过用户行为表象看到用户深层的动机与心理。

3:行业报告与用户研究。通过对用户画像的分析可以了解行业动态,比如90后人群的消费偏好趋势分析、高端用户青睐品牌分析、不同地域品类消费差异分析等等。这些行业的洞察可以指导平台更好的运营、把握大方向,也能给相关公司(中小企业、店铺、媒体等)提供细分领域的深入洞察。


感想:

用户画像是对人的深入挖掘,除了基本的人口统计学信息、地理位置、设备资产等客观属性之外,如兴趣偏好等是自由度很大的标签,在很多应用题场景,广告主(或需求方)更需要用户兴趣、价值观、人格层面的标签。比如汽车客户,环保类的电动车品牌想要触达的是有环保意识、喜欢小排量的用户,这就涉及到人的价值观层面了,因此制作这些标签的时候不能仅仅通过用户行为直接产生,需要更深入人格的建模。随着互联网野蛮生长时代的消退以及数据技术的进一步提升,从人心理、人格层面的深度分析将逐渐得到重视和应用。我十分期待阿里能构建一套基于人格心理学的标签,这必将给淘宝带来更好的用户体验,增加我这种不喜欢花哨页面用户的停留时间。

收集自知乎

SofaSofa数据科学社区DS面试题库 DS面经

Josh_Josh   2019-03-18 09:38

4

就是为用户构建属性,比如性别、年龄等人口属性,工作地、居住地、常去地等地点属性,实际工作中,有的需要建模预测,有的只需做数据统计或简单的计算。一般用于在广告投放的时候,确定受众标签,所以构建时通常要考虑准确率和用户群体的覆盖率

SofaSofa数据科学社区DS面试题库 DS面经

咸魚   2019-03-15 12:34

3

我的理解就是把一个个用户抽象化,转成结构化的多维数据,比如对于电商,用户画像包括地区、年龄、性别、购买力、购买倾向、购买频次等。

SofaSofa数据科学社区DS面试题库 DS面经

桐桐酱   2019-03-24 13:17



  相关主题

机器学习算法中有哪些用到了贪婪算法的思想?   5回答

如何理解PAC Learning?   1回答

在线算法(online algorithm)是什么意思?   2回答

机器学习中的投票算法是指什么?   2回答

脑纹锁 有开源项目吗   1回答

seq2seq模型有什么应用场景?   0回答

机器学习算法的鲁棒性是什么意思?   1回答

加性模型是什么意思?   2回答

Bagging是什么意思?   3回答

推荐开放数据库   5回答

人类的第一个机器学习算法是什么?   2回答

ensemble模型时,bagging和stacking有什么区别?   2回答



回答问题时需要注意什么?

我们谢绝在回答前讲“生动”的故事。

我们谢绝“这么简单,你自己想”、“书上有的,你认真看”这类的回答;如果你认为对方的提问方式或者内容不妥,你可以直接忽略该问题,不用进行任何作答,甚至可以对该问题投反对票。

我们谢绝答非所问。

我们谢绝自己不会、硬要回答。

我们感激每一个用户在编写答案时的努力与付出!