KD-tree:解决 如何忽略比目前找到最近的点更远的点?这一问题
最后分割导致每个块中的点的个数比较接近,每个叶子节点的数据点个数尽量均匀,如果不均匀的话,可能导致某点数据点较多,计算这个点的计算开销会比较大。
这样就容易找到X,Y的范围
中位数(Median):又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。
取中位数方便把数据点均分,而均值则做不到这点(均值容易对异常点敏感,中位数更加合适)
最近距离:圈的半径
查询的主要思想是维护目前找到的最小距离,当发现节点边界的距离要大于最小距离时,该节点中的所有点都不可能是最近邻居
第三个图,数据有抖动,但是抖动没有规律,一般认为是噪声带来的抖动