9. 预测每个新房源的终生价值(LTV) /  Predict lifetime value(LTV) of new listings at AirBnB
【AirBnB爱彼迎】

  展开问题

AirBnB想要预测一个新房源总共能够给网站带来多少收益,也就是一个新房源的终生价值(LTV)。
假如你有新房源的所有信息资料,但是新房源还没有正式上线,所以并没有订单信息或者住户评价。
你怎么利用历史数据来预测新房源的LTV呢?

参考答案:卷49:机器学习

8. 判断注册邮箱是否为个人邮箱  /  Determine whether email accounts are personal
【LinkedIn领英】

  展开问题

领英上有的用户使用公司邮箱注册(比如@fb.com,@google.com),有的用户则使用个人邮箱注册(比如@qq.com, @gmail.com, @foxmail.com)。
邮箱的域名已经数以百万,我们需要判断这些邮箱域名,如@xxx.com是否为个人邮箱还是公司域名的邮箱。

假设你可以利用LinkedIn上所有的数据,你会使用哪些数据,如何建立模型?
假如这个模型可以准确地判断用户账号是用公司邮箱注册还是个人邮箱注册的,那么这个模型在领英的实际商业中有什么意义?

参考答案:卷49:机器学习

7. 检测网上问卷是否是乱填的  /  Detect fradulent/invalid online surveys
【Google谷歌】

  展开问题

当我们收集网络问卷的回答时,经常出现填写者乱填导致问卷无效的情况。在进行分析问卷调查的结果前,我们希望排除掉这些质量低的问卷。
假设问卷并没有标准答案,假设问卷调查只包含选择题,你可以收集你所需要的数据,那么该如何进行检测,剔除质量低的问卷呢?

参考答案:卷49:机器学习

6. LinkedIn智能信息回复  /  LinkedIn's smart reply
【LinkedIn领英】

  展开问题

LinkedIn现在提供了智能回复消息的功能。目前有两个版本的智能回复系统,你如何判断哪种更好?
如果在电脑上用户使用智能回复的频率小于手机上使用智能回复的频率,但是系统提供的智能回复的内容不受设备影响,你该如何解读这一现象?

参考答案:卷46:AB Test

5. 新用户提问激励  /  New askers' "feed boost"
【Quora】

  展开问题

Quora是美国最大的问答社区,为了改善提问者的用户体验,Quora决定进行所谓"feed boost"的实验。
在这项实验中,所有3个月内注册的新用户将被等概率分成实验组(test)与对照组(control),各50%。被分到实验组的新用户的问题将有更大的几率出现在别人的首页中,通过提高问题的曝光量来使得新用户的问题更有可能被快速解答;对照组的新用户则没有此项特殊照顾。实验将进行3周。

参考答案:卷46:AB Test

4. 如何激励司机多开车  /  Test incentive plans to encourage drivers
【Uber优步】

  展开问题

Uber计划给司机额外的现金奖励(10美元),希望他们能在下午4点到晚上8点的时间段多开车。如果司机能在当天的高峰时段内完成5次载客,他们就可以获得现金奖励。
你想用哪些指标(metrics)来判断这次激励计划是否成功?
你将如何进行实验?

参考答案:卷46:AB Test

3. 预测沃尔玛门店的某种商品销量  /  Forecast sales of a product at Wal-mart stores
【Walmart沃尔玛】

  展开问题

准确预测产品的效率有助于仓储、物流的调控。如果你有过去该商品在各个门店每周的销量,你如何建立模型预测未来的销量?
除了销量信息,你还想获取哪些有助于模型的信息?
如何评判模型的准确度?

参考答案:卷43:机器学习

2. 检测Twitter上的假账号  /  Identify fake accounts on Twitter
【Twitter推特】

  展开问题

Twitter上有很多假账号,他们影响到很多用户的正常使用。
如果你有Twitter上所有用户的信息,以及一些被标记出来的假账号,你怎么利用这些信息来检测出Twitter上的假账号?
如果你有Twitter上所有用户的信息,但是这些用户都没有被标记,那么你怎么利用这些信息来检测出Twitter上的假账号?

参考答案:卷43:机器学习

1. 预测Linkedin用户是否准备跳槽  /  Predict whether a person is going to change job
【LinkedIn领英】

  展开问题

假设你现在有LinkedIn上所有用户的各项数据,你如何预测某个用户这三个月内是否跳槽?
你准备使用哪些数据?使用什么模型?

参考答案:卷43:机器学习

机器学习 数据科学 案例分析 场景应用 面经 DS case study AB testing 一亩三分地 牛客 1point3acres nowcoder Data Science 北美 BAT facebook google airbnb expedia uber 滴滴 美团 bittiger data analytics linkedin snapchat adobe amazon microsift


案列分析
Case Study

data science case study


不用慌、不用怕!先来详细了解下什么是Case Study。

Data Science面试中越来越流行考case study,也就是我们通常说的案例分析或者场景应用题。

这部分是考察求职的综合能力,从商业思维到数据敏感度,再到概率统计,以及机器学习的常用方法。概括来说,就是考察求职者如何熟练地运用机器学习、统计分析的知识来解决实际的商业问题。

这类的面试题对于没有工作经验或者实习经验的应届生来说往往非常棘手。但是一旦掌握了这类面试题的规律和套路,也很容易在面试中顺利过关,甚至答出亮点。

一些大公司的经典面试题已经在本页面中整理出来。

这类问题的答案并未唯一,通常自圆其说即可,“答题思路”仅供参考。