内容脚本 Content Scripts

内容脚本是在网页上下文中运行的文件。 通过使用标准的文档对象模型(DOM),他们能够读取浏览器访问网页的详细信息,对其进行更改并将信息传递给其父扩展。

了解内容脚本功能

内容脚本可以通过与扩展程序交换消息来访问其父扩展程序使用的 Chrome API。他们还可以使用 chrome.runtime.getURL() 访问扩展程序文件的 URL,并使用与其他 URL 相同的结果。

  1. //Code for displaying <extensionDir>/images/myimage.png:
  2. var imgURL = chrome.runtime.getURL("images/myimage.png");
  3. document.getElementById("someImage").src = imgURL;

此外,内容脚本可以直接访问以下 chrome API:

内容脚本无法直接访问其他 API。

在孤立的世界中执行

内容脚本生活在一个孤立的世界中,它允许内容脚本对其 JavaScript 环境进行更改,而不会与页面或其他内容脚本发生冲突。

扩展程序可以使用类似于以下示例的代码在网页中运行。

  1. <html>
  2. <button id="mybutton">click me</button>
  3. <script>
  4. var greeting = "hello, ";
  5. var button = document.getElementById("mybutton");
  6. button.person_name = "Bob";
  7. button.addEventListener("click", function() {
  8. alert(greeting + button.person_name + ".");
  9. }, false);
  10. </script>
  11. </html>

该扩展可以注入以下内容脚本。

  1. var greeting = "hola, ";
  2. var button = document.getElementById("mybutton");
  3. button.person_name = "Roberto";
  4. button.addEventListener("click", function() {
  5. alert(greeting + button.person_name + ".");
  6. }, false);

如果按下该按钮,将同时出现两个 alert。

孤立的世界不允许扩展的内容脚本和网页互相访问彼此的变量或函数。这也使内容脚本能够启用网页不能访问的功能。Youtube

注入脚本

内容脚本可以以代码方式或声明方式注入。

以代码方式注入

对需要在特定情况下运行的内容脚本使用代码注入。

要注入代码式内容脚本,请在 manifest 中赋予activeTab 权限。 这将赋予对当前主机的安全访问权限以及对选项卡的临时访问权限,从而使内容脚本可以在当前活动选项卡上运行,而无需指定跨域权限

  1. {
  2. "name": "My extension",
  3. ...
  4. "permissions": [
  5. "activeTab"
  6. ],
  7. ...
  8. }

内容脚本可以作为代码注入。

  1. chrome.runtime.onMessage.addListener(
  2. function(message, callback) {
  3. if (message == changeColor”){
  4. chrome.tabs.executeScript({
  5. code: 'document.body.style.backgroundColor="orange"'
  6. });
  7. }
  8. });

或者可以注入整个文件。

  1. chrome.runtime.onMessage.addListener(
  2. function(message, callback) {
  3. if (message == runContentScript”){
  4. chrome.tabs.executeScript({
  5. file: 'contentScript.js'
  6. });
  7. }
  8. });

声明式注入

在指定页面上自动运行的内容脚本可使用声明式注入。

以声明方式注入的脚本被注册在 manifest 的 “content_scripts” 字段下。它们可以包括JavaScript 文件或 CSS 文件。所有自动运行的内容脚本都必须指定匹配模式

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "css": ["myStyles.css"],
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }
Name Type Description
matches 字符串数组 必需。指定此内容脚本将被注入到哪些页面。
css 字符串数组 可选。要插入匹配页面的CSS文件列表。在为页面构造或显示任何DOM之前,将按照它们在此数组中出现的顺序注入它们。
js 字符串数组 可选。要插入匹配页面的JavaScript文件列表。以它们在此数组中出现的顺序注入。
match_about_blank boolean 可选。脚本是否应该注入到 about:blank 框架中,其中父框架或opener 框架与 match 中声明的模式之一相匹配。默认为false。

Exclude Matches and Globs

通过在 manifest 注册中包括以下字段,可以自定义指定页面匹配。

Name Type Description
exclude_matches 字符串数组 可选。排除此内容脚本将被注入的页面。
include_globs 字符串数组 可选。 在 matches 后应用,以匹配与此 glob 匹配的URL。旨在模拟 @exclude 油猴关键字。
exclude_globs 字符串数组 可选。 在 matches 后应用,以排除与此 glob 匹配的URL。旨在模拟 @exclude 油猴关键字。

如果内容脚本的 URL 匹配任何 matches 模式和任何 include_globs 模式,则该内容脚本将被注入到页面中,只要 URL 不匹配 exclude_matches 或 exclude_globs 模式。

因为 matchs 属性是必需的,所以 exclude_matches,include_globs 和exclude_globs 限制于仅可影响哪些页面。

以下扩展会将内容脚本注入到 http://www.nytimes.com/health 中,但不会注入到 http://www.nytimes.com/business 中。

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "exclude_matches": ["*://*/*business*"],
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }

match patterns 相比,Glob 属性遵循更灵活的语法。可接受的 Glob 字符串可能包含“通配符”星号和问号的 URL。 星号 * 匹配任意长度的字符串,包括空字符串,而问号 ?匹配任何单个字符。

例如,glob http://???.example.com/foo/* 匹配以下任何一个:

  • http:// www .example.com/foo /bar
  • http:// the .example.com/foo / 

但是,它不匹配以下条数:

此扩展程序会将内容脚本注入 http://www.nytimes.com/arts/index.htmlhttp://www.nytimes.com/jobs/index.html, 但不会注入 http://www.nytimes.com/sports/index.html

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "include_globs": ["*nytimes.com/???s/*"],
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }

此扩展程序会将内容脚本注入 http://history.nytimes.comhttp://.nytimes.com/history, 但不会注入 http://science.nytimes.comhttp://www.nytimes.com/science

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "exclude_globs": ["*science*"],
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }

可以包括其中的一个,多个或全部,以匹配到到正确的范围。

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "exclude_matches": ["*://*/*business*"],
  8. "include_globs": ["*nytimes.com/???s/*"],
  9. "exclude_globs": ["*science*"],
  10. "js": ["contentScript.js"]
  11. }
  12. ],
  13. ...
  14. }

Run Time

将 JavaScript 文件注入网页时,由 run_at 字段控制。首选的默认字段是“document_idle”,但如果需要,也可以指定为 “document_start” 或“document_end”。

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "run_at": "document_idle",
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }
Name Type Description
document_idle string 首选。 尽可能使用 “document_idle”。浏览器选择一个时间在 “document_end” 和window.onload 事件触发后立即注入脚本。 注入的确切时间取决于文档的复杂程度以及加载所需的时间,并且已针对页面加载速度进行了优化。在 “document_idle” 上运行的内容脚本不需要监听 window.onload 事件,因此可以确保它们在 DOM 完成之后运行。如果确实需要在window.onload 之后运行脚本,则扩展可以使用 document.readyState 属性检查 onload 是否已触发。
document_start string 在 css 文件之后,但在构造其他 DOM 或运行其他脚本前注入。
document_end string 在 DOM 创建完成后,但在加载子资源(例如 images 和 frames )之前,立即注入脚本。

其他 Frames

“all_frames” 字段指定扩展是将 JavaScript 和 CSS 文件注入到符合指定 URL 的所有 Frames 中,还是仅注入到选项卡中最顶部的 Frame 中。

  1. {
  2. "name": "My extension",
  3. ...
  4. "content_scripts": [
  5. {
  6. "matches": ["http://*.nytimes.com/*"],
  7. "all_frames": true,
  8. "js": ["contentScript.js"]
  9. }
  10. ],
  11. ...
  12. }
Name Type Description
all_frames boolean 可选。默认为 false,表示仅匹配顶部 frame。如果指定为 true,则它将注入所有 frame,即使该frame 不是选项卡中最上面的 frame 也是如此。 独立检查每个 frame 的 URL,如果不满足 URL,则不会将其插入子 frame。

与嵌入页面的通信

尽管内容脚本的执行环境和托管它们的页面是相互隔离的,但是它们共享对页面 DOM 的访问。如果页面希望与内容脚本或通过内容脚本与扩展通信,则它必须通过共享 DOM 进行通信。

可以使用 window.postMessage 来完成一个示例:

  1. var port = chrome.runtime.connect();
  2. window.addEventListener("message", function(event) {
  3. // We only accept messages from ourselves
  4. if (event.source != window)
  5. return;
  6. if (event.data.type && (event.data.type == "FROM_PAGE")) {
  7. console.log("Content script received: " + event.data.text);
  8. port.postMessage(event.data.text);
  9. }
  10. }, false);
  1. document.getElementById("theButton").addEventListener("click",
  2. function() {
  3. window.postMessage({ type: "FROM_PAGE", text: "Hello from the webpage!" }, "*");
  4. }, false);

非扩展页面 example.html 将消息发布到其自身。内容脚本会拦截并检查此消息,然后将其发布到扩展。这样,页面就建立了与扩展过程的通讯线路。通过类似的方式可以实现相反的效果。

保持安全

尽管孤立的世界提供了一层保护,但使用内容脚本可能会在扩展程序和网页中创建漏洞。如果内容脚本从另一个网站接收内容(例如发出 XMLHttpRequest),请在注入内容之前小心过滤跨站点脚本攻击。 仅使用 HTTPS 通信,以避免“中间人”攻击。

确保过滤掉恶意网页。例如,以下模式很危险:

  1. var data = document.getElementById("json-data")
  2. // WARNING! Might be evaluating an evil script!
  3. var parsed = eval("(" + data + ")")
  1. var elmt_id = ...
  2. // WARNING! elmt_id might be "); ... evil script ... //"!
  3. window.setTimeout("animate(" + elmt_id + ")", 200);

相反,请选择不会运行脚本的更安全的 API:

  1. var data = document.getElementById("json-data")
  2. // JSON.parse does not evaluate the attacker's scripts.
  3. var parsed = JSON.parse(data);
  1. var elmt_id = ...
  2. // The closure form of setTimeout does not evaluate scripts.
  3. window.setTimeout(function() {
  4. animate(elmt_id);
  5. }, 200);

关注 微信公众号「程序化思维」 获取最新 Chrome 插件开发教程。

mp_wechat