Sigmoid函数
    同乘人相似度计算:
    其中x1为碰撞场所个数,x2为碰撞次数,x3为碰撞时长(小时)
    实现:

    0.5(1/(1+exp(count(distinct placeid))))+ 0.2(1/(1+exp(count(1))))+ 0.3*(1/(1+exp((max(catchtime)-min(catchtime))/3600.0)))

    select day,carid, imsi1, imsi2,0.5(1/(1+exp(-1count(distinct placeid))))+ 0.2(1/(1+exp(-1count(1))))+ 0.3(1/(1+exp(-1(max(catchtime)-min(catchtime))/3600.0))) as sim

    乘车相似度计算
    其中其中x1为碰撞场所个数,x2为碰撞次数,x3为碰撞时长(小时),x4为同时乘车的数量。
    实现:

    (0.3(1/(1+exp(continue_time)))+0.2(1/(1+exp(cn)))+0.5*(1/(1+exp(placecn))))/partener_car

    按照我们的定性理解,随着预测值趋近于1或者0,单位自变量的变动所能产生的影响会越来越小
    因变量是虚拟变量违背了回归正态性和同方差性的假设。???
    而logistics回归模型就可以有效缓解以上问题,即其是一种较为科学地估计因变量为0和1的模型的方法。

    https://zhuanlan.zhihu.com/p/45683123

    作用域:将一个 (−∞ ,+∞ ) 之内的实数值变换到区间 [0,1]

    测量值 X 的取值区间是 (−∞ ,+∞ ) ,概率 P 的取值区间是 [0,1]。
    https://zhuanlan.zhihu.com/p/24990626