描述
字典 wordList 中从单词 beginWord 和 endWord 的 转换序列 是一个按下述规格形成的序列:
- 序列中第一个单词是
beginWord。 - 序列中最后一个单词是
endWord。 - 每次转换只能改变一个字母。
- 转换过程中的中间单词必须是字典
wordList中的单词。
给你两个单词 beginWord 和 endWord和一个字典 wordList ,找到从 beginWord 到 endWord 的 最短转换序列 中的 单词数目 。如果不存在这样的转换序列,返回 0。
示例
示例 1:
输入:beginWord = "hit", endWord = "cog", wordList = ["hot","dot","dog","lot","log","cog"]输出:5解释:一个最短转换序列是 "hit" -> "hot" -> "dot" -> "dog" -> "cog", 返回它的长度 5。
示例 2:
输入:beginWord = "hit", endWord = "cog", wordList = ["hot","dot","dog","lot","log"]输出:0解释:endWord "cog" 不在字典中,所以无法进行转换。
提示
1 <= beginWord.length <= 10endWord.length == beginWord.length1 <= wordList.length <= 5000wordList[i].length == beginWord.lengthbeginWord、endWord和wordList[i]由小写英文字母组成beginWord != endWordwordList中的所有字符串 互不相同
解题思路
建图 + 广度优先遍历
单词接龙
广度优先遍历、双向广度优先遍历(Java)
方法一:广度优先遍历
我们可以把每个单词都抽象为一个点,如果两个单词可以只改变一个字母进行转换,那么说明他们之间有一条双向边。因此我们只需要把满足转换条件的点相连,就形成了一张图。
基于该图,我们以 beginWord 为图的起点,以 endWord 为终点进行广度优先搜索,寻找 beginWord 到 endWord 的最短路径。
算法
我们在遍历一开始,把所有的单词列表放进一个哈希表 wordSet 中,然后在遍历的时候构建图,每一次得到在单词列表里可以转换的单词.
使用 BFS 进行遍历,需要的辅助数据结构是:
- 队列;
visited集合。说明:可以直接在wordSet(由wordList放进集合中得到)里做删除。但更好的做法是新开一个哈希表,遍历过的字符串放进哈希表里。这种做法具有普遍意义。绝大多数在线测评系统和应用场景都不会在意空间开销。
代码
import java.util.ArrayList;import java.util.Collections;import java.util.HashSet;import java.util.LinkedList;import java.util.List;import java.util.Queue;import java.util.Set;public class Solution {public int ladderLength(String beginWord, String endWord, List<String> wordList) {// 第 1 步:先将 wordList 放到哈希表里,便于判断某个单词是否在 wordList 里Set<String> wordSet = new HashSet<>(wordList);if (wordSet.size() == 0 || !wordSet.contains(endWord)) {return 0;}wordSet.remove(beginWord);// 第 2 步:图的广度优先遍历,必须使用队列和表示是否访问过的 visited 哈希表Queue<String> queue = new LinkedList<>();queue.offer(beginWord);Set<String> visited = new HashSet<>();visited.add(beginWord);// 第 3 步:开始广度优先遍历,包含起点,因此初始化的时候步数为 1int step = 1;while (!queue.isEmpty()) {int currentSize = queue.size();for (int i = 0; i < currentSize; i++) {// 依次遍历当前队列中的单词String currentWord = queue.poll();// 如果 currentWord 能够修改 1 个字符与 endWord 相同,则返回 step + 1if (changeWordEveryOneLetter(currentWord, endWord, queue, visited, wordSet)) {return step + 1;}}step++;}return 0;}/*** 尝试对 currentWord 修改每一个字符,看看是不是能与 endWord 匹配** @param currentWord* @param endWord* @param queue* @param visited* @param wordSet* @return*/private boolean changeWordEveryOneLetter(String currentWord, String endWord,Queue<String> queue, Set<String> visited, Set<String> wordSet) {char[] charArray = currentWord.toCharArray();for (int i = 0; i < endWord.length(); i++) {// 先保存,然后恢复char originChar = charArray[i];for (char k = 'a'; k <= 'z'; k++) {if (k == originChar) {continue;}charArray[i] = k;String nextWord = String.valueOf(charArray);if (wordSet.contains(nextWord)) {if (nextWord.equals(endWord)) {return true;}if (!visited.contains(nextWord)) {queue.add(nextWord);// 注意:添加到队列以后,必须马上标记为已经访问visited.add(nextWord);}}}// 恢复charArray[i] = originChar;}return false;}}
方法二:双向广度优先遍历
思路及解法
根据给定字典构造的图可能会很大,而广度优先搜索的搜索空间大小依赖于每层节点的分支数量。假如每个节点的分支数量相同,搜索空间会随着层数的增长指数级的增加。考虑一个简单的二叉树,每一层都是满二叉树的扩展,节点的数量会以 2 为底数呈指数增长。
如果使用两个同时进行的广搜可以有效地减少搜索空间。一边从 beginWord 开始,另一边从 endWord 开始。我们每次从两边各扩展一层节点,当发现某一时刻两边都访问过同一顶点时就停止搜索。这就是双向广度优先搜索,它可以可观地减少搜索空间大小,从而提高代码运行效率。

- 已知目标顶点的情况下,可以分别从起点和目标顶点(终点)执行广度优先遍历,直到遍历的部分有交集。这种方式搜索的单词数量会更小一些;
- 更合理的做法是,每次从单词数量小的集合开始扩散;
- 这里
beginVisited和endVisited交替使用,等价于单向 BFS 里使用队列,每次扩散都要加到总的visited里。
代码
import java.util.ArrayList;import java.util.Collections;import java.util.HashSet;import java.util.List;import java.util.Set;public class Solution {public int ladderLength(String beginWord, String endWord, List<String> wordList) {// 第 1 步:先将 wordList 放到哈希表里,便于判断某个单词是否在 wordList 里Set<String> wordSet = new HashSet<>(wordList);if (wordSet.size() == 0 || !wordSet.contains(endWord)) {return 0;}// 第 2 步:已经访问过的 word 添加到 visited 哈希表里Set<String> visited = new HashSet<>();// 分别用左边和右边扩散的哈希表代替单向 BFS 里的队列,它们在双向 BFS 的过程中交替使用Set<String> beginVisited = new HashSet<>();beginVisited.add(beginWord);Set<String> endVisited = new HashSet<>();endVisited.add(endWord);// 第 3 步:执行双向 BFS,左右交替扩散的步数之和为所求int step = 1;while (!beginVisited.isEmpty() && !endVisited.isEmpty()) {// 优先选择小的哈希表进行扩散,考虑到的情况更少if (beginVisited.size() > endVisited.size()) {Set<String> temp = beginVisited;beginVisited = endVisited;endVisited = temp;}// 逻辑到这里,保证 beginVisited 是相对较小的集合,nextLevelVisited 在扩散完成以后,会成为新的 beginVisitedSet<String> nextLevelVisited = new HashSet<>();for (String word : beginVisited) {if (changeWordEveryOneLetter(word, endVisited, visited, wordSet, nextLevelVisited)) {return step + 1;}}// 原来的 beginVisited 废弃,从 nextLevelVisited 开始新的双向 BFSbeginVisited = nextLevelVisited;step++;}return 0;}/*** 尝试对 word 修改每一个字符,看看是不是能落在 endVisited 中,扩展得到的新的 word 添加到 nextLevelVisited 里** @param word* @param endVisited* @param visited* @param wordSet* @param nextLevelVisited* @return*/private boolean changeWordEveryOneLetter(String word, Set<String> endVisited,Set<String> visited,Set<String> wordSet,Set<String> nextLevelVisited) {char[] charArray = word.toCharArray();for (int i = 0; i < word.length(); i++) {char originChar = charArray[i];for (char c = 'a'; c <= 'z'; c++) {if (originChar == c) {continue;}charArray[i] = c;String nextWord = String.valueOf(charArray);if (wordSet.contains(nextWord)) {if (endVisited.contains(nextWord)) {return true;}if (!visited.contains(nextWord)) {nextLevelVisited.add(nextWord);visited.add(nextWord);}}}// 恢复,下次再用charArray[i] = originChar;}return false;}}
