每一个优化的算法后面都有一个优化的数据结构,而分词算法背后的数据结构就是Trie树。
    1.什么是Trie树:trie树就是我们平常说的字典树,它是一种专门用来处理字符串匹配的数据结构。特别适合用来在很多字符串中快速查找某一个特定的字符串。
    其实也叫前缀树,赫夫曼树,前缀编码
    2.Trie的数据结构:假设我们有以下几个英文单词:my name apple age sex,假如我们要查找里面某一个字符串是否存在,你怎么去找呢?
    散列表:hashMap
    如果利用Trie树我们该怎么来解决上面的查找问题呢?
    我们可以将上面的字符串变成以下结构,利用字符串的公共前缀,将重复的合在一起组成一颗树,即为我们所要讲的trie树。
    image.png
    image.png
    image.png