问:你从 100 个硬币中随机抽取 1 个硬币——这 100 个硬币中有 1 个不公正硬币(两面都是国徽),99 个公正硬币(正常硬币)——然后抛这枚硬币 10 次当作果。如果结果 10 次都是国徽面朝上,那么这枚硬币是不公正的概率是多少?
可以利用贝叶斯定理来解答。贝叶斯定理的扩展方程如下:
假设捡到不公正硬币的概率表示为 P(A),而连续抛 10 次都是国徽面朝上的概率表示为 P(B)。那么 P(B|A) 即是 1,P(B|A) 即是 0.11,而 P(¬A) 即是 0.99。

套入等式,则 P(A|B)=0.9118 或 91.18%。
问:有一栋 100 层的建筑物。给你两个相同的鸡蛋。如何利用这两个鸡蛋找到阈值层,也便是从阈值层以上(含该层)扔下鸡蛋后鸡蛋一定会冲破。
更详细地说,问题是寻求给定两个鸡蛋后找到阈值层的 最佳 方法。
为了更好地理解这个问题,我们假设你只有一个鸡蛋。要找到阈值层,你只需从第一层开始扔鸡蛋,然后一次往上移一层直到鸡蛋扔下去会碎为止。
现在想象一下,假设我们有无限的鸡蛋。查找阈值下限的最佳方法是二进制搜索。首先,你该当从 50 楼开始。如果鸡蛋分裂,则将鸡蛋从 25 层扔下去;如果鸡蛋没有碎,则将鸡蛋拿到 75 层,然后重复此过程,直到找到阈值层为止。
但是只有两个鸡蛋的情形下,找到阈值层的最佳方法是上述两个办理方案的稠浊。
例如,你可以每隔 5 层扔下第一个鸡蛋,直到它碎裂为止,然后利用第二个鸡蛋找出阈值层在末了这 5 层之间的哪一层。在最坏的情形下,这种方法须要扔 24 次。
如果你每隔 10 层扔下第一个鸡蛋直到它碎裂,在最坏的情形下将须要扔 19 次,这比每隔 5 层扔下第一个鸡蛋要好得多。但如果你想要更好的方案呢?
这里就要引入 最大遗憾最小化(minimization of maximum regret) 这个观点了。基本上,这意味着当你以给定的增量(跳过多少个楼层)扔鸡蛋时,你希望每扔一次后,下一次都减小一点增量,由于这样的话包含阈值层的层数就会变少。也便是说,如果你的第一次扔鸡蛋是在第 n 层,假设它没有碎裂,那么你第二次扔鸡蛋该当在第 n+(n-1)层。可以写成以下等式:
更进一步,上式可以简化为:
求解 n,得出大约 14。因此,你的策略是从第 14 层开始,然后是 14+13,然后是 14+13+12,依此类推,直到它碎裂,然后利用第二个鸡蛋一次上一层来找到阈值层!
问:我们有两种在信息流中投放广告的选项。选项 1:每 25 个故事中有 1 个是广告。选择 2:每个故事都有 4%的机会成为广告。对付每个选项而言,在 100 个新闻故事中预期展示的广告数量是多少?
两个选项的期望概率都是 100 分之 4。
对付选项 1,1/25 即是 4/100。
对付选项 2,100 的 4%为 4/100。
是不是以为答案看起来太大略了?假如我拉下什么东西的话请指出来!
问:如果只知道不同性别的身高数据,如何证明男性身高均匀比女性高?
你可以利用假设考验来证明男性均匀身高高于女性。
零假设方法假定男性和女性的均匀身高相同,而备择假设方法假定男性的均匀身高大于女性的均匀身高。
然后,你会网络一个随机的男性和女性身高样本,并利用 t 考验来判断是否要谢绝这个零值。
问:如果 iOS 上 70%的 Facebook 用户利用 Instagram,而 Android 上只有 35%的 Facebook 用户利用 Instagram,你该如何调查这种差异的缘故原由?
有很多可能导致这种差异的变量,我会检讨下列成分:
iOS 和 Android 用户的受众特色可能会有很大差异。例如,据 Hootsuite 称(https://blog.hootsuite.com/instagram-demographics/),有 43%的女性利用 Instagram,而男性只有 31%。如果 iOS 的女性用户比例明显大于 Android 的女性用户,那就可以阐明这种差异(或至少阐明一部分)。年事、种族、宗教崇奉、地域等成分也都可以考虑进来。行为成分也会产生差异。如果 iOS 用户比 Android 用户更频繁地利用手机,那么与那些花更少韶光在手机上的用户比较,前者更可能沉迷于 Instagram 和其他运用。要考虑的另一个可能成分是 Google Play 和 App Store 的差异。例如,如果 Android 用户明显有更多的运用(和社交媒体运用)可供选择,则可能导致更大的用户稀释度。末了,与 iOS 用户比较,用户体验上的任何差异都可能让 Android 用户不那么喜好利用 Instagram。如果与 iOS 用户比较,Android 用户的运用有更多缺点,那么他们在运用上生动的可能性就会小一些。问:某个平台上用户均匀点赞数,以及用户在这个平台上花费的韶光正在增加,但平台用户总数却在减少。可能导致这种情形的根本缘故原由会是什么?
一样平常来说,你可能须要讯问口试官以获取更多信息,不过这里假设这是他 / 她乐意供应的唯一信息。
这里该当把稳用户的均匀点赞数,这有两个缘故原由。第一个缘故原由是,随着韶光的流逝,用户的均匀参与度每每会增加——这是有道理的,由于随着韶光的流逝,生动用户更可能是平台的虔诚用户,由于利用该平台已成为一种习气做法。每个用户的点赞数会增加的另一个缘故原由是,分母(用户总数)正在减少。假设停滞利用该平台的用户是不生动的用户,也便是很少参与并且点赞数低于均匀水平的用户,那么他们的退出将增加用户整体的均匀点赞数。
上面的阐明也可以用来阐明用户在平台上花费的韶光。随着韶光的流逝,生动用户变得越来越生动,而很少利用平台的用户会退出平台。总体而言,前者带来的参与度提升超过了后者退出的影响。
更进一步,“参与度低的用户”很可能是 Facebook 之前没检测到的机器人。但是随着韶光的流逝,Facebook 已经能够开拓算法来创造和删除机器人。如果以前存在大量的机器人,这可能便是造成这种征象的根本缘故原由。
问:Facebook 看到点赞数按年同比增长了 10%,为什么会这样?
某一年份的总点赞数取决于用户总数和每个用户的均匀点赞数(我将其称为参与度)。
用户总数会增加的一些潜在缘故原由如下:由于国际扩展而得到了新的用户,以及年事较小的人群随着年事的增长而开始注册 Facebook。
参与度提高的一些潜在缘故原由包括:越来越忠实的用户利用运用的几率增加、新功能和新特性的影响以及用户体验改进的影响。
问:如果我们正在测试产品 X,那么你会考虑采取哪些指标来确定它是否取得了成功?
决定产品成功的指标取决于业务模型以及企业要通过产品实现的目标。《精益剖析》一书提出了一个很好的框架,可以用来确定在给定场景中要利用的指标:
问:如果某项目经理说他们想让信息流中的广告数量增加一倍,你如何确定这是不是一个好主张?
你可以将用户分为两组来实行 A/B 测试:分别是具有正常广告数量的对照组和具有两倍广告数量的测试组。然后,你将选择用来定义什么是“好主张”的指标。例如,我们可以说零假设是广告数量增加一倍会减少在 Facebook 上花费的韶光,备择假设是广告数量增加不会对在 Facebook 上花费的韶光产生任何影响。你还可以选择其他指标,例如生动用户数或客户流失落率等。接下来,你会进行测试并确定测试的统计显著性,以谢绝或不谢绝零值。
问:在一个游戏中,你会得到两个公正的六面骰子,并须要投掷骰子。如果骰子上的值之和即是 7,则你会赢得 21 美元。但是,每次掷两个骰子都必须支付 5 美元。你会玩这个游戏吗?
掷出 7 的几率是 1/6。
这意味着 期望 条件下你须要支付 $30(56)才能赢得 $21。
比拟这两个数字,期望的花费为 -$9(21–30)。
由于预期的收益为负,因此你不会玩这个游戏。
干系资源
Google 的数据科学口试脑筋急转弯:
https://towardsdatascience.com/googles-data-science-interview-brain-teasers-7f3c1dc4ea7f
40 个针对数据科学家的统计口试问题与解答:
https://towardsdatascience.com/40-statistics-interview-problems-and-answers-for-data-scientists-6971a02b7eee
亚马逊的数据科学家口试实践问题:
https://towardsdatascience.com/amazon-data-scientist-interview-practice-problems-15b9b86e86c6
5 个针对数据科学家的常见 SQL 口试问题:
https://towardsdatascience.com/40-statistics-interview-problems-and-answers-for-data-scientists-6971a02b7eee
Facebook 数据科学口试:
https://medium.com/acing-ai/facebook-ai-interview-questions-acing-the-ai-interview-5982add0af55
Facebook 数据科学家口试问题:
https://www.glassdoor.ca/Interview/Facebook-Data-Scientist-Interview-Questions-EI_IE40772.0,8_KO9,23_IP3.htm
Facebook 数据科学家口试:
https://towardsdatascience.com/the-facebook-data-scientist-interview-38556739e872
Facebook 数据科学口试问题例选:
http://mockinterview.co/index.php/2018/04/07/sample-data-science-interview-questions-from-facebook/