袋子里有黑白球各100个,每次从袋子里取2个球,若取的球颜色相同,则放入1个黑球,若不同,则放入1个白球。 最后袋子里剩下1个黑球的概率

剩下的全是白球,连续异或
对桶中的球而言,取出2个球共有3种情况:

1、取出两个黑球,放回一个黑球
2、取出两个白球,放回一个黑球
2、取出一黑一白,放回一个白球

将上述的过程抽象成为数学上的异或运算:

1、2个黑球变成1个黑球 ==> 1 ^ 1 = 1
2、2个白球变成1个黑球 ==>0 ^ 0 = 1
3、1白1黑变成1个白球 ==> 1 ^ 0 = 1

在上述的抽象的过程中,主要利用了异或的性质:相同得0,不同得1。因此可以将同色时放入的黑球用0代替,异色时放入的白球用1代替。

由于异或运算满足结合律(a ^ b ^ c = a ^ (b ^ c))和交换律(a ^ b = b ^ c),那么就有
a ^ b ^ c = a ^ c ^ b = b ^ a ^ c = b ^ c ^ a = c ^ a ^ b = c ^ b ^ a

也就是异或结果与异或的顺序无关,任意的异或顺序最终计算的结果都是一致的。

桶中取出100个黑白球,不断取出2个球放回一个球,就是不断取出两个数异或,并将异或结果放回计算序列。也就是,将所有的数进行异或就是最终的结果。

例如有2个黑球和2个白球,就是1^ 1 ^ 0 ^ 0 = 0, 无论任何的取出顺序最终都将获得黑球(对应数字0)

那么,100个黑球和100个白球,也就是100个0和100个1连续异或的结果。连续异或结果是0,也就是最终剩下的一定是黑球。也就是剩下黑球的概率为100%,剩下白球的概率是0。

如果,是5个黑球和5个白球。那么5个1和5个0连续异或,异或的结果是1,那么最终剩下的结果是1,也就是最终剩下的一定是白球。也就是剩下白球的概率是100%,剩下黑球的概率是0。

二分类threshold增大,准确率和召回率怎么变

哪种分类算法可以处理数据不平衡

KNN,因为每次只用了周边相近的样本的标签做更新

线性模型—异方差、序列相关、多重共线性与内生性的处理

logistic回归时同时加入L1和L2的效果

防止过拟合,并且做一些特征选择
因为
L1:各元素绝对值之和,可用于特征选择
L2:防止过拟合,提升泛化
L1可以得到稀疏权值,L2得到平滑权值

假设检验α显著水平的意义

估计总体参数落在某一区间内,可能犯错的概率用α表示

SVM欠拟合怎么办

增大惩罚参数C的值,使模型复杂度上升

ML笔试模拟题