Sigmoid函数
同乘人相似度计算:
其中x1为碰撞场所个数,x2为碰撞次数,x3为碰撞时长(小时)
实现:
| 0.5(1/(1+exp(count(distinct placeid))))+ 0.2(1/(1+exp(count(1))))+ 0.3*(1/(1+exp((max(catchtime)-min(catchtime))/3600.0))) |
|---|
select day,carid, imsi1, imsi2,0.5(1/(1+exp(-1count(distinct placeid))))+ 0.2(1/(1+exp(-1count(1))))+ 0.3(1/(1+exp(-1(max(catchtime)-min(catchtime))/3600.0))) as sim
乘车相似度计算
其中其中x1为碰撞场所个数,x2为碰撞次数,x3为碰撞时长(小时),x4为同时乘车的数量。
实现:
| (0.3(1/(1+exp(continue_time)))+0.2(1/(1+exp(cn)))+0.5*(1/(1+exp(placecn))))/partener_car |
|---|
按照我们的定性理解,随着预测值趋近于1或者0,单位自变量的变动所能产生的影响会越来越小
因变量是虚拟变量违背了回归正态性和同方差性的假设。???
而logistics回归模型就可以有效缓解以上问题,即其是一种较为科学地估计因变量为0和1的模型的方法。
https://zhuanlan.zhihu.com/p/45683123
作用域:将一个 (−∞ ,+∞ ) 之内的实数值变换到区间 [0,1]
测量值 X 的取值区间是 (−∞ ,+∞ ) ,概率 P 的取值区间是 [0,1]。
https://zhuanlan.zhihu.com/p/24990626
