热乎乎的面试题 想听听大家的答案!

  板凳区 面试    浏览次数:1773        分享
1

1. 3个IID feature,然后第4个和第三个一样,那么第一个dimension的variance占多少

2.有人偷到你的feature value和predicted outcome(0或1),能reverse engineer你的logistic regression model吗? 

3. 10000个random binary feature,然后其中两个XOR决定label,你用random forest的accuracy是多少?

4. 10%的positive case proportion降为5%,你原来的80%的precision会变成多少?

 

tianjiayang0711   2019-04-29 13:42



   2个回答 
1

1. 3个IID feature,然后第4个和第三个一样,那么第一个dimension的variance占多少

不太明白,所以是有4个feature吗?

2.有人偷到你的feature value和predicted outcome(0或1),能reverse engineer你的logistic regression model吗? 

应该不能。如果知道predicted probability应该就可以了。

3. 10000个random binary feature,然后其中两个XOR决定label,你用random forest的accuracy是多少?

准确度是100%?

4. 10%的positive case proportion降为5%,你原来的80%的precision会变成多少?

如果其他情况都不变的话,应该还是80%吧。不过条件太少了,真实情况未必80%。

SofaSofa数据科学社区DS面试题库 DS面经

abuu   2019-04-29 14:33

0

感觉题目不简单啊,请问是哪个公司的面试啊

SofaSofa数据科学社区DS面试题库 DS面经

何立诚   2019-04-30 03:56



  相关讨论

一个人向北走了一公里,然后向东走1公里,然后向南走一公里的问题

面试官说“你有什么问题要问我的吗?”,该怎么回答?

概率方面小弱,有什么比较好的入门学习网站或者资料推荐

【招聘】 商业数据分析专家(北京)

如何评价大数据的未来?

有人关注机器学习在量化交易中的应用吗?

大家跑模型都用的什么牌子的笔记本

有没有赚外快的方法啊

求教一下:怎么进阶

有偿!!如何写一个restful api

  随便看看

统计学中的自变量和因变量分别是什么意思?

为啥Xgboost比GradientBoost好那么多?

怎么按照设定概率产生不重复的随机排序?

z test和t test什么区别?

软聚类,硬聚类?