AB Testing里Geo Hashing是什么意思?

  统计/机器学习 AB Test    浏览次数:2334        分享
1

我明白AB Testing的意思,是用来做对照实验的。但是AB Testing里Geo Hashing的概念是什么意思呢?

 

levyhou   2019-08-16 15:12



   2个回答 
4

AB testing要求A和B的流量都是随机独立的。但是有时候无法建立这样的A和B,geo hashing可以帮助完成。

比如产品投放的城市有n个,每个城市都从1到n被随机编号,然后设计一个hash function把编号hash到{1, 2}。组1的当作A,组2的当作B,这样就实现了一个伪随机的AB testing的设置。

SofaSofa数据科学社区DS面试题库 DS面经

AlphaCat   2019-09-02 10:18

明白了,多谢 - levyhou   2019-09-21 09:28
2

Geo Hashing其实就是AB实验哈希分流中的一种,不过是按照地理位置的id来hashing的。

安装人群(比如用户id)来做hashing基本上能保证流量的平均化,但是Geo就不一定了,所以在通过哈希得到了很多小切片之后,选择实验组和对照组的时候,需要考虑每个切片的权重(比如UV或者GMV),这样才能保证分流的结果与预期的配比是一致的。

SofaSofa数据科学社区DS面试题库 DS面经

Zeus1998   2022-04-26 13:46



  相关讨论

AB检验里的spillover effect是什么意思?

AB实验的哈希分桶技术是什么意思?

AB测试样本量的问题

AB实验里的灰度实验概念是什么意思?

双盲实验是什么意思?

如果样本不是正态分布,还能用t-test或者z-test吗?

AB检测里selection bias是什么?

MAB里的tompson抽样算法是怎么操作的?

如何从假设检验的角度去理解AB testing

怎么提高一个假设检验的效力(power)?

  随便看看

如果数据不是正态分布,能用3sigma原则剔除异常值吗?

怎么按照设定概率产生不重复的随机排序?

pytorch里view(-1, 1)什么意思?

为什么样本方差是除以n-1

python里的<<或者>>符号是什么意思?