tf idf加权

    TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。

    余弦相似度快速计算:近似

    以及如何选最大k个文档

    堆排序