不同于自然语言处理(Natural Language Processing),数据挖掘领域对文本处理有自己的一套方法来避免自然语言处理中的两大限制:

    1. 标注花费高(或者大量的数词个数等统计工作),新语言或领域扩展性不强
    2. 不一定适用具体领域、动态、新兴应用(比如Yelp,Twitter等)