tf idf加权
    TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。
    余弦相似度快速计算:近似
    以及如何选最大k个文档
    堆排序