selenium

  1. ChromeDriver driver = new ChromeDriver(); //创建谷歌浏览器的驱动
  2. try {
  3. driver.get("http://www.baidu.com"); //打开百度
  4. driver.manage().window().maximize();//最大化
  5. WebElement kw = driver.findElementById("kw"); //定位输入框
  6. kw.click(); //点击
  7. kw.sendKeys("selenium"); //在输入框中输入"selenium"
  8. driver.findElementById("su").click(); //定位“百度一下” 并点击
  9. //Thread.sleep(Integer.MAX_VALUE);
  10. }finally {
  11. driver.quit(); //退出
  12. }

浏览器导航

导航

启动浏览器后,您要做的第一件事就是打开您的网站。这可以在一行中完成:

  1. //Convenient
  2. driver.get("https://selenium.dev");
  3. //Longer way
  4. driver.navigate().to("https://selenium.dev");

获取当前URL

您可以使用以下方法从浏览器的地址栏中读取当前URL:

  1. driver.getCurrentUrl();

回退

按下浏览器的后退按钮:

  1. driver.navigate().back();

前进

按下浏览器的前进按钮:

  1. driver.navigate().forward();

刷新

刷新当前页面:

  1. driver.navigate().refresh();

获取标题

您可以从浏览器中读取当前页面标题:

  1. driver.getTitle();

Windows和标签页

获取窗口句柄

WebDriver不会在窗口和选项卡之间进行区分。如果您的站点打开一个新的选项卡或窗口,Selenium将允许您使用窗口句柄来使用它。每个窗口都有一个唯一的标识符,该标识符在单个会话中保持不变。您可以使用以下方法获取当前窗口的窗口句柄:

  1. driver.getWindowHandle();

切换视窗或标签

点击一个在 新窗户 将使新窗口或选项卡聚焦在屏幕上,但是WebDriver将不知道操作系统认为哪个窗口处于活动状态。要使用新窗口,您将需要切换到它。如果仅打开两个选项卡或窗口,并且知道从哪个窗口开始,则通过消除过程,您可以遍历WebDriver可以看到的两个窗口或选项卡,并切换到非原始窗口或选项卡。

但是,Selenium 4提供了新的API 新窗户 这会创建一个新标签页(或新窗口)并自动切换到该标签页。

  1. //存储当前窗口的id
  2. String originalWindow = driver.getWindowHandle();
  3. //检查是否有其他的窗口打开了
  4. assert driver.getWindowHandles().size() == 1;
  5. //点击链接打开一个新的窗口
  6. driver.findElement(By.linkText("new window")).click();
  7. //为这个新窗口等待
  8. wait.until(numberOfWindowsToBe(2));
  9. //找到新的窗口的句柄并切换到新窗口
  10. for (String windowHandle : driver.getWindowHandles()) {
  11. if(!originalWindow.contentEquals(windowHandle)) {
  12. driver.switchTo().window(windowHandle);
  13. break;
  14. }
  15. }
  16. //等待新窗口完成加载
  17. wait.until(titleIs("Selenium documentation"));

创建新窗口(或)新标签并切换

创建一个新窗口(或)选项卡,并将新窗口或选项卡聚焦在屏幕上。您无需切换为使用新窗口(或)标签。如果除了新窗口之外还打开了两个以上的窗口(或)选项卡,则可以循环浏览WebDriver可以看到的两个窗口或选项卡,然后切换到非原始窗口或选项卡。

注意:此功能适用于Selenium 4和更高版本。

  1. // 打开新的标签并切换
  2. driver.switchTo().newWindow(WindowType.TAB);
  3. // 打开新的窗口并切换
  4. driver.switchTo().newWindow(WindowType.WINDOW);

关闭窗口或标签

完成窗口或选项卡后它又不是浏览器中打开的最后一个窗口或选项卡,则应将其关闭并切换回以前使用的窗口。假设您遵循了上一节中的代码示例,则将先前的窗口句柄存储在变量中。放在一起,您将获得:

  1. //关闭标签或窗口
  2. driver.close();
  3. //切换到原来的窗口
  4. driver.switchTo().window(originalWindow);

框架和iframe

框架是现在不建议使用的方法,它可以从同一域中的多个文档构建网站布局。除非您使用HTML5之前的Webapp,否则您不太可能与他们合作。iframe允许从完全不同的域插入文档,并且仍然很常用。

如果需要使用框架或iframe,WebDriver允许您以相同的方式使用它们。考虑一下iframe中的按钮。如果使用浏览器开发工具检查元素,则可能会看到以下内容:

  1. <div id="modal">
  2. <iframe id="buttonframe" name="myframe" src="https://seleniumhq.github.io">
  3. <button>Click here</button>
  4. </iframe>
  5. </div>

如果不是iframe,我们希望使用类似以下内容的按钮:

  1. //不能工作
  2. driver.findElement(By.tagName("button")).click();

但是,如果iframe外部没有按钮,则可能会收到一个没有此类元素的错误。发生这种情况是因为Selenium仅了解顶级文档中的元素。要与按钮交互,我们将需要首先切换到框架,类似于切换窗口的方式。WebDriver提供了三种切换到框架的方式。

使用WebElement

使用WebElement进行切换是最灵活的选择。您可以使用首选选择器找到框架并切换到该框架。

  1. //获取iframe
  2. WebElement iframe = driver.findElement(By.cssSelector("#modal>iframe"));
  3. //切换到iframe
  4. driver.switchTo().frame(iframe);
  5. //这是就可以点击按钮了
  6. driver.findElement(By.tagName("button")).click();

使用名称或ID

如果您的框架或iframe具有id或name属性,则可以使用它。如果名称或ID在页面上不是唯一的,则第一个找到的名称或ID将被切换到。

  1. //使用id
  2. driver.switchTo().frame("buttonframe");
  3. //使用name
  4. driver.switchTo().frame("myframe");
  5. //这是就可以点击按钮了
  6. driver.findElement(By.tagName("button")).click();

使用索引

也可以使用框架的索引,例如可以使用JavaScript中的window.frames查询。

  1. //切换到第二个iframe
  2. driver.switchTo().frame(1);

离开框架

要保留iframe或框架集,请切换回默认内容,如下所示:

  1. driver.switchTo().defaultContent();

窗口管理

屏幕分辨率会影响Web应用程序的呈现方式,因此WebDriver提供了用于移动和调整浏览器窗口大小的机制。

获取窗口大小

  1. //分别访问每个维度
  2. int width = driver.manage().window().getSize().getWidth();
  3. int height = driver.manage().window().getSize().getHeight();
  4. //或存储尺寸并稍后查询
  5. Dimension size = driver.manage().window().getSize();
  6. int width1 = size.getWidth();
  7. int height1 = size.getHeight();

设定视窗大小

恢复窗口并设置窗口大小。

  1. driver.manage().window().setSize(new Dimension(1024, 768));

获取窗口位置

获取浏览器窗口左上角的坐标。

  1. // 分别访问每个维度
  2. int x = driver.manage().window().getPosition().getX();
  3. int y = driver.manage().window().getPosition().getY();
  4. // 或存储位置并稍后查询
  5. Point position = driver.manage().window().getPosition();
  6. int x1 = position.getX();
  7. int y1 = position.getY();

设定视窗位置

将窗口移到所选位置。

  1. // 将窗口移到主显示器的左上方
  2. driver.manage().window().setPosition(new Point(0, 0));

最大化窗口

放大窗口。对于大多数操作系统,窗口将填满整个屏幕,而不会阻塞操作系统自己的菜单和工具栏。

  1. driver.manage().window().maximize();

最小化窗口

最小化当前浏览上下文的窗口。此命令的确切行为特定于各个窗口管理器。

最小化窗口通常会将窗口隐藏在系统托盘中。

注意:此功能适用于Selenium 4和更高版本。

  1. driver.manage().window().minimize();

全屏窗口

填充整个屏幕,类似于在大多数浏览器中按F11。

  1. driver.manage().window().fullscreen();

截屏

用于捕获当前浏览上下文的屏幕截图。WebDriver端点屏幕截图 返回以Base64格式编码的屏幕截图。

  1. File scrFile = ((TakesScreenshot)driver).getScreenshotAs(OutputType.FILE);
  2. FileUtils.copyFile(scrFile, new File("./image.png"));

TakeElement屏幕截图

用于捕获当前浏览上下文的元素的屏幕快照。WebDriver端点屏幕截图 返回以Base64格式编码的屏幕截图。

  1. WebElement element = driver.findElement(By.cssSelector("h1"));
  2. File scrFile = element.getScreenshotAs(OutputType.FILE);
  3. FileUtils.copyFile(scrFile, new File("./image.png"));

执行脚本

在所选框架或窗口的当前上下文中执行JavaScript代码段。

  1. //通过类型转换创建JavascriptExecutor接口对象
  2. JavascriptExecutor js = (JavascriptExecutor)driver;
  3. //按钮元素
  4. WebElement button =driver.findElement(By.name("btnLogin"));
  5. //通过点击按钮执行js
  6. js.executeScript("arguments[0].click();", element);
  7. //得到返回值
  8. String text = (String) js.executeScript("return arguments[0].innerText", element);
  9. //直接执行JavaScript
  10. js.executeScript("console.log('hello world')");

打印页面

在浏览器中打印当前页面。

注意:这要求Chromium浏览器处于无头模式

  1. printer = (PrintsPage) driver;
  2. PrintOptions printOptions = new PrintOptions();
  3. printOptions.setPageRanges("1-2");
  4. Pdf pdf = printer.print(printOptions);
  5. String content = pdf.getContent();

等待

WebDriver通常可以说具有阻塞API。因为它是一个进程外的库, 指示浏览器该做什么,并且因为Web平台具有本质上异步的性质,所以WebDriver不会跟踪DOM的活动实时状态。这带来了一些挑战,我们将在这里讨论。

根据经验,由于使用Selenium和WebDriver而引起的大多数间歇性问题都与浏览器和用户说明之间发生的争用情况有关。一个示例可能是用户指示浏览器导航到页面,然后在尝试查找元素时收到没有此类元素错误。

考虑以下文档:

  1. <!doctype html>
  2. <meta charset=utf-8>
  3. <title>Race Condition Example</title>
  4. <script>
  5. var initialised = false;
  6. window.addEventListener("load", function() {
  7. var newElement = document.createElement("p");
  8. newElement.textContent = "Hello from JavaScript!";
  9. document.body.appendChild(newElement);
  10. initialised = true;
  11. });
  12. </script>

明确等待

Selenium客户可以使用命令式,程序性语言进行显式等待。它们允许您的代码暂停程序执行或冻结线程,直到传递给它的条件解决为止。以一定的频率调用该条件,直到等待超时超时为止。这意味着只要条件返回虚假值,它将一直尝试并等待。

由于显式等待使您可以等待条件发生,因此它们非常适合在浏览器及其DOM和WebDriver脚本之间同步状态。

为了纠正前面提到的错误指令集,我们可以使用一个等待来等待findElement调用,直到脚本中动态添加的元素已添加到DOM中为止:

  1. driver.findElement(By.name("q")).sendKeys("cheese" + Keys.ENTER);
  2. // 初始化并等待element(link)变为可单击-超时10秒
  3. WebElement firstResult = new WebDriverWait(driver, Duration.ofSeconds(10))
  4. .until(ExpectedConditions.elementToBeClickable(By.xpath("//a/h3")));
  5. System.out.println(firstResult.getText());

我们将条件作为函数引用传入,该等待将重复运行,直到其返回值为true。“真实的”返回值是在手头语言中评估为布尔值true的任何值,例如字符串,数字,布尔值,对象(包括WebElement)或填充的(非空)序列或列表。这意味着空列表的结果为false。当条件为真且阻塞等待被中止时,该条件的返回值将成为等待的返回值。

有了这些知识,并且由于默认情况下wait工具不会忽略任何此类元素错误,因此我们可以将指令重构为更加简洁:

  1. WebElement foo = new WebDriverWait(driver, Duration.ofSeconds(3))
  2. .until(driver -> driver.findElement(By.name("q")));
  3. assertEquals(foo.getText(), "Hello from JavaScript!");

在该示例中,我们传入了一个匿名函数(但我们也可以像我们之前所做的那样显式定义它,以便可以重用)。传递给我们的条件的第一个也是唯一的参数始终是对驱动程序对象WebDriver的引用。在多线程环境中,应该小心操作传递给条件的驱动程序引用,而不是外部作用域中对驱动程序的引用。

因为等待不会吞没找不到元素时引发的此类元素错误,所以条件将重试直到找到元素。然后它将使用返回值WebElement,并将其传递回我们的脚本。

如果条件失败,例如从未达到该条件的真实返回值,则等待将抛出/引发一个错误/异常,称为超时错误

选件

可以根据您的需求定制等待条件。有时不必等待默认超时的全部时间,因为未达到成功条件的代价可能会很高。

通过等待,您可以传入一个参数来覆盖超时:

  1. new WebDriverWait(driver, Duration.ofSeconds(3)).until(ExpectedConditions.elementToBeClickable(By.xpath("//a/h3")));

预期条件

因为必须同步DOM和您的指令是很常见的事,所以大多数客户端还带有一组预定义的预期条件。顾名思义,它们是为频繁的等待操作预定义的条件。

不同语言绑定中可用的条件各不相同,但这不是其中的一些穷举列表:

  • 警报存在
  • 元素存在
  • 元素可见
  • 标题包含
  • 标题是
  • 元素陈旧
  • 可见文字

隐式等待

还有第二种等待方式,与 明确的等待称为隐式等待。通过隐式等待,WebDriver在尝试查找任何元素时会轮询DOM一定时间。当网页上的某些元素无法立即使用并且需要一些时间来加载时,这很有用。

默认情况下,隐式等待元素出现是禁用的,需要基于每个会话手动启用。混合明确的等待 隐式等待会导致意想不到的后果,即即使元素可用或条件为true,也要等待睡眠最长时间。

警告: 请勿混合使用隐式和显式等待。这样做可能导致无法预测的等待时间。例如,将隐式等待设置为10秒,将显式等待设置为15秒,则可能导致20秒后发生超时。

隐式等待是告诉WebDriver在尝试查找一个或多个元素(如果它们不立即可用)时轮询DOM一定时间。默认设置为0,表示已禁用。设置后,将在会话生命周期内设置隐式等待。

  1. driver.manage().timeouts().implicitlyWait(10, TimeUnit.SECONDS);
  2. driver.get("http://somedomain/url_that_delays_loading");
  3. WebElement myDynamicElement = driver.findElement(By.id("myDynamicElement"));

FluentWait流利的等待

FluentWait实例定义了等待条件的最长时间,以及检查条件的频率。

用户可以配置等待以在等待时忽略特定类型的异常,例如 NoSuchElementException 在页面上搜索元素时。

  1. // 等待30秒,页面上会显示一个元素,然后检查
  2. // 每5秒一次。
  3. Wait<WebDriver> wait = new FluentWait<WebDriver>(driver)
  4. .withTimeout(Duration.ofSeconds(30))
  5. .pollingEvery(Duration.ofSeconds(5))
  6. .ignoring(NoSuchElementException.class);
  7. WebElement foo = wait.until(new Function<WebDriver, WebElement>() {
  8. public WebElement apply(WebDriver driver) {
  9. return driver.findElement(By.id("foo"));
  10. }
  11. });

JavaScript警报,提示和确认

WebDriver提供了一个API,用于处理JavaScript提供的三种类型的本机弹出消息。这些弹出窗口由浏览器设置样式,并提供有限的自定义。

Alerts快讯

其中最简单的称为警报,它显示一条自定义消息,以及一个用于关闭该警报的按钮,在大多数浏览器中标记为“确定”。在大多数浏览器中,也可以通过按“关闭”按钮将其关闭,但这始终与“确定”按钮具有相同的作用。查看警报示例。

WebDriver可以从弹出窗口中获取文本,并接受或关闭这些警报。

  1. //单击链接以激活警报
  2. driver.findElement(By.linkText("See an example alert")).click();
  3. //等待警报显示并将其存储在变量中
  4. Alert alert = wait.until(ExpectedConditions.alertIsPresent());
  5. //将警报文本存储在变量中
  6. String text = alert.getText();
  7. //按确定按钮
  8. alert.accept();

Confirm确认

确认框类似于警报,不同之处在于用户还可以选择取消消息。 查看样品确认。

此示例还显示了另一种存储警报的方法:

  1. //单击链接以激活警报
  2. driver.findElement(By.linkText("See a sample confirm")).click();
  3. //等待警报显示
  4. wait.until(ExpectedConditions.alertIsPresent());
  5. //将警报存储在变量中
  6. Alert alert = driver.switchTo().alert();
  7. //将警报存储在变量中以供重用
  8. String text = alert.getText();
  9. //按取消按钮
  10. alert.dismiss();

Prompt提示

提示与确认框相似,不同之处在于它们还包括文本输入。与处理表单元素类似,您可以使用WebDriver的send键来填充响应。这将完全替换占位符文本。按下取消按钮将不会提交任何文本。 查看示例提示。

  1. //单击链接以激活警报
  2. driver.findElement(By.linkText("See a sample prompt")).click();
  3. //等待警报显示并将其存储在变量中
  4. Alert alert = wait.until(ExpectedConditions.alertIsPresent());
  5. //输入您的讯息
  6. alert.sendKeys("Selenium");
  7. //按确定按钮
  8. alert.accept();

Http代理

代理服务器充当客户端和服务器之间的请求的中介。简单来说,流量将通过代理服务器流向您请求的地址并返回。

使用Selenium的自动化脚本代理服务器可能对以下方面有所帮助:

  • 捕获网络流量
  • 网站发出的模拟后端通话
  • 在复杂的网络拓扑结构或严格的公司限制/政策下访问所需的网站。

如果您在公司环境中,并且浏览器无法连接到URL,则最有可能是因为环境需要访问代理。

Selenium WebDriver提供了一种代理设置的方法:

  1. Proxy proxy = new Proxy();
  2. proxy.setHttpProxy("<HOST:PORT>");
  3. ChromeOptions options = new ChromeOptions();
  4. options.setCapability("proxy", proxy);
  5. WebDriver driver = new ChromeDriver(options);

页面加载策略

定义当前会话的页面加载策略。默认情况下,当Selenium WebDriver加载页面时,它遵循_正常的_pageLoadStrategy。始终建议您在页面加载花费大量时间时停止下载其他资源(例如图像,css,js)。

document.readyState文档的属性描述当前文档的加载状态。默认情况下,WebDriver将推迟响应driver.get() (要么) driver.navigate().to() 调用直到文档就绪状态为 complete

在SPA应用程序(如Angular,React,Ember)中,一旦动态内容已加载(即,如果pageLoadStrategy状态为COMPLETE),则单击链接或在页面内执行某些操作将不会向服务器发出新请求,因为内容在客户端动态加载,而无需刷新整个页面。

SPA应用程序可以动态加载许多视图,而无需任何服务器请求,因此pageLoadStrategy将始终显示 COMPLETE 状态,直到我们做一个新的 driver.get()driver.navigate().to()

WebDriver pageLoadStrategy支持以下值:

normal正常

这将使Selenium WebDriver等待整个页面加载。设置为normal时,Selenium WebDriver会一直等到 加载 返回事件火。

默认情况下,如果未提供浏览器,则将normal设置为浏览器。

  1. ChromeOptions chromeOptions = new ChromeOptions();
  2. chromeOptions.setPageLoadStrategy(PageLoadStrategy.NORMAL);
  3. WebDriver driver = new ChromeDriver(chromeOptions);

eager急于

这将使Selenium WebDriver等待直到完全加载并解析了初始HTML文档,并放弃了样式表,图像和子帧的加载。

设置为eager时,Selenium WebDriver等待直到 DOMContentLoaded 返回事件火。

  1. ChromeOptions chromeOptions = new ChromeOptions();
  2. chromeOptions.setPageLoadStrategy(PageLoadStrategy.EAGER);
  3. WebDriver driver = new ChromeDriver(chromeOptions);

none

设置为none时, Selenium WebDriver仅等待下载初始页面。

  1. ChromeOptions chromeOptions = new ChromeOptions();
  2. chromeOptions.setPageLoadStrategy(PageLoadStrategy.NONE);
  3. WebDriver driver = new ChromeDriver(chromeOptions);