image.png
    image.png
    KD-tree:解决 如何忽略比目前找到最近的点更远的点?这一问题
    image.png
    image.png
    image.png
    image.png
    image.png
    最后分割导致每个块中的点的个数比较接近,每个叶子节点的数据点个数尽量均匀,如果不均匀的话,可能导致某点数据点较多,计算这个点的计算开销会比较大。
    image.png
    这样就容易找到X,Y的范围
    image.png
    中位数(Median):又称中值,统计学中的专有名词,是按顺序排列的一组数据中居于中间位置的数,代表一个样本、种群或概率分布中的一个数值,其可将数值集合划分为相等的上下两部分。
    取中位数方便把数据点均分,而均值则做不到这点(均值容易对异常点敏感,中位数更加合适)
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    最近距离:圈的半径
    查询的主要思想是维护目前找到的最小距离,当发现节点边界的距离要大于最小距离时,该节点中的所有点都不可能是最近邻居
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    第三个图,数据有抖动,但是抖动没有规律,一般认为是噪声带来的抖动
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png
    image.png