给出2个文件,能口喷一段代码完成模块打包和执行的核心逻辑 模块加载器的实现(与闭包有什么关系,如何实现找文件的 动态加载的,如何避免多次加载,如何缓存的) 描述异步模块加载实现原理,amd/cmd中的实现方案,webpack中的实现方案

打包不过是,从入口文件开始,将所有模块及依赖的模块输出到包文件中,并且可以在浏览器中运行。
那么它就分为四步:

  • 获取入口文件内容,及其所有依赖
  • 依次获取所有的依赖模块内容,及其依赖的依赖,…,获取整个依赖图
  • 将依赖图包装进一个能够在所有浏览器运行的立即执行函数
  • 输出到./dist/bundle.js

模块规范:

  • AMD(Asynchronous Module Definition异步模块定义):被定义为用于浏览器中模块的异步模型,RequireJS 是 AMD 最受欢迎的实现;
  • CMD(Common Module Definition通用模块定义):它本质上一段 JavaScript 代码,放置在库的顶部,可让任何加载程序、任何环境加载它们;
  • ES2015(ES6):定义了异步导入和导出模块的语义,会编译成 require/exports 来执行的,这也是我们现今最常用的模块定义;

模块化**捆绑是打包器需要实现的两个最主要功能:**
模块化:html载入多个js文件,需要注意引用的顺序不然会报错。所以,我们需要将每个依赖项模块化,让打包器帮助我们管理这些依赖项,让每个依赖项能够在正确的时间、正确的地点被正确的引用。

捆绑:多个文件合并成一个文件,http请求一次即可

minipack

BUILD YOUR OWN WEBPACK by Ronen Amiel

下面提出问题:如果我要实现这样的模块打包器,面临的问题及解决的思路
1、从哪里入手分析依赖 => 多入口麻烦,单入口开始 依次构造出依赖图
2、当分析到这个文件需要某个依赖之后,怎么记录及怎么深入
==》 图的遍历算法,当读到这个文件有依赖另一个文件时,
深度优先
3、怎么保证代码不重复加载的,被需要的模块即使被引用了多次,最后打包的时候也只打包了一次
==》 去重,用hash key
4、怎么控制加载顺序的? 依赖顺序是a->b ->c, 可以让c先加载然后b然后a,如果是html写js文件的思路可能是


这样决定加载顺序,所有文件的载入是阻塞的,所以能够a加载时c、b已经加载完了;
但是在一个bundlejs文件里,是怎么决定的 c载入完全后 a载入的呢
5、分包等控制


1、依赖关系图的结构设计

一个模块的信息,需要下面四个东西:

  1. 文件名字和文件标识
  2. 在文件系统中文件的位置
  3. 文件中的代码
  4. 该文件需要哪些依赖

image.png

问题:
1、怎么解析app.js文件里的require(‘./utils/request.js’)的相对路径找到 ‘user/yxy/src/utils/request.js’的?
2、不同的组件引用同一个文件,写法区别require(‘./utils/index’); require(‘../utils/index’) 怎么定位到是一个文件的 key 不一样
即业务代码你写的时候可以直接在某文件里写相对路径引入隔壁的文件 比如require(‘./utils’), 但是站在整个模块打包系统的角度,当模块解析器执行到require(‘./utils’)这一行时,打包器是怎么知道./utils文件在哪里的?

3、文件里的代码 和 抛出的代码的存放
文件里引用代码资源的:先引用,然后执行(相当于把源代码拿进来)
文件里直接的代码:直接运行
文件里抛出的代码:调用权交给别人

下面引入模块图的概念

如上app.js所示,每个模块会有单独的id标记,每当解析到一个module时就给这个module一个id,id=>sourcecode
比如同样引用一个printf模块,引用时各自使用的相对路径,那么最简单的解决办法就是重复引多次即使指向的是一个文件(因为key不一样)
app.js写的是 import print from ‘./utils/printf.js’;
utils/requet.js里写的是 import print from ‘./printf.js’;
每当模块加载器读到当前文件时,根据from指定的路径,就去把那个文件的源代码拿进来,modules里存放
问题:(我是杠精)如果在app.js 隔壁有个printjs,解析module1的时候隔壁也有个printjs但是他们是不一样的printf,不过引用时的key一样,会影响吗?
==> 不会,因为modules map是 每个模块自有一个的。而modules模块图才是全局的,依靠id维护
image.png

image.png

3、遍历graph构建出bundle

小总结:
拿到了graph依赖图之后,生成bundle的过程:
1、确定bundle的代码结构

  1. const modulemap = {
  2. 0: [func, dependencies],// entry 文件
  3. 1: [func, dependencies],
  4. 2: [func, dependencies],
  5. }
  6. (function(modules){
  7. function require(id) {
  8. const [fn, mapping] = modules[id]; # 拿到id对应的源代码和就近维护的本地依赖图
  9. const localRequire = name => require(mapping[name]);# 包装后的require函数
  10. fn(localRequire, module, module.exports); # 执行id对应的源代码
  11. }
  12. require(0) // 从entry开始 不断递归执行
  13. })(modulemap)

2、具体的设计:

  1. const modulemap = {
  2. 0: [
  3. function (require, module, exports) {
  4. // require, module, exports 采用commonjs规范
  5. // require是框架里的全局调用者 注入到当前业务代码的一个调用能力
  6. // 使用者可以 require('./utils/print.js') 就能拿到在全局备份的那个代码
  7. },
  8. {// 就近维护的 本地 => 全国的 映射
  9. "./module1/index.js": 1,
  10. "./module2/index.js": 2,
  11. "./utils/print.js": 3
  12. }
  13. ]
  14. }
  15. # modulemap如何构造生成的?
  16. let modules = '';
  17. graph.forEach(mod => {
  18. modules += `${mod.id}: [
  19. function (require, module, exports) { ${mod.code} },
  20. ${JSON.stringify(mod.mapping)},
  21. ],`;
  22. });

这里的require和modulemap的配合设计十分巧妙:
1、从require函数角度
一个资源调用者:

输入当前执行的模块所在的全局唯一标识id,拿着依赖关系图根据id找到id所在模块信息(源代码及依赖); 包装了一个localRequire函数 给业务者使用: localRequire: path => require(mapping[path]) 使得业务方可以传入 相对路径的模块,就能找到全局对应的那个模块;赋予了本地以全局的能力 (闭包 与 装束的 强大之处)

2、从整个系统角度
(相对路径就能找到资源的解决)
1、每发现依赖一个模块,就用id标记这个模块,记录备份源代码到全局的map里 (id自增记录模块
(从入口entry不断深入每个依赖)
entry的id为0,require(id);

每个模块自维护 dependies,这样就能 在每个文件以相对路径 引入模块,但是相对路径 找 文件时仍能准确定位到文件;
3、开放api层面
业务方:不想管那么多,只想就近取源码,import relativepath;
框架方:好,满足!
维护一个大map,管理全局的所有文件,relativepath你就地维护一个map,从当地到全国的映relativepath:id

然后解决下残余问题:

  • 1、graph的由来,如何搜集到这些信息的,graph的结构设计

2、commonjs的 module, exports 这两个变量,
import {name} from ‘./utils’ 怎么按需拿到指定的export的?==>babel转译

  1. const module = {
  2. exports: {}
  3. };
  4. fn(localRequire, module, module.exports);
  5. # 这样设计的有意义

2、graph的构建

graph的设计,每个模块包含的信息:

  • 文件标识id
  • 在文件系统中文件的位置filename //当前文件的名字,用于和dependencies的relativepath构建生成为唯一路径
  • 文件中的代码code
  • 该文件需要哪些依赖dependencies

解析出这些信息不难,大致就是引用读取文件后生成ast,从ast里读取到需要的信息;
而mapping的构建 是 根据文件信息解析完善后,生成mapping,同时dfs

  1. [{
  2. "id": 0,
  3. "filename": "./example/index.js",
  4. "dependencies": [
  5. "./module1/index.js",
  6. "./module2/index.js",
  7. "./utils/print.js"],
  8. "code": "
  9. 'use strict';
  10. require('./module1/index.js');
  11. require('./module2/index.js');
  12. var _print = require('./utils/print.js');
  13. var _print2 = _interopRequireDefault(_print);
  14. function _interopRequireDefault(obj) {
  15. return obj && obj.__esModule ? obj : {
  16. default: obj
  17. };
  18. }
  19. (0, _print2.default)('加载start');
  20. (0, _print2.default)('加载end');
  21. ",
  22. # mapping是拿到单个文件信息后 解析dependencies得到的mapping
  23. "mapping": {
  24. "./module1/index.js": 1,
  25. "./module2/index.js": 2,
  26. "./utils/print.js": 3
  27. }
  28. }]

构建出这样的图之后,我们只会取code、mapping字段,生成最终的modulesmap

  1. modules += `${mod.id}: [
  2. function (require, module, exports) { ${mod.code} },
  3. ${JSON.stringify(mod.mapping)},
  4. ],`;

疑问:modules的注入

commonjs的 module, exports 这两个变量,import {name} from ‘./utils’ 怎么按需拿到指定的export的?
===> 好像没用 具体的抛出抛入的变量得到 是babel转译的功效

  1. const module = {
  2. exports: {}
  3. };
  4. fn(localRequire, module, module.exports);
  5. # 这样设计的有意义
  6. (function(modules){
  7. function require(id) {
  8. const [fn, mapping] = modules[id];
  9. const localRequire = name => require(mapping[name]);
  10. const module = { exports : {} };# 每个文件定义一个module,传入fn给业务使用
  11. fn(localRequire, module, module.exports);
  12. return module.exports;# 业务使用后返回module变量 将局部变量挂载在module
  13. }
  14. require(0) // 从entry开始 不断递归执行
  15. })(modulemap)

类似于

  1. var module = {
  2. exports: {}
  3. };
  4. (function(module, exports) {
  5. exports.multiply = function (n) { return n * 1000 };
  6. }(module, module.exports))
  7. var f = module.exports.multiply;
  8. f(5) // 5000

第一版的完整代码

  1. const fs = require('fs');
  2. const path = require('path');
  3. const babylon = require('babylon');
  4. const traverse = require('babel-traverse').default;
  5. const {transformFromAst} = require('babel-core');
  6. let ID = 0;
  7. // 我们首先创建一个函数,该函数将接受 文件路径 ,读取内容并提取它的依赖关系.
  8. // createAsset('./example/index.js');
  9. // 传入文件路径,读取文件源码,解析import关键字
  10. // babylon解析源码生成ast,从而得到关键信息 https://astexplorer.net
  11. /**
  12. *
  13. * @param {*} filename 文件路径
  14. * @returns 文件的信息 obj
  15. * 包含:
  16. * id: 当前文件对应的全局标识id(每读一个文件 全局ID自增维护
  17. * filename:文件路径(从当前文件目录出发的路径)
  18. * dependencies:文件依赖的模块集合
  19. * code:源代码
  20. */
  21. function createAsset(filename) {
  22. // 以字符串形式读取文件的内容.
  23. const content = fs.readFileSync(filename, 'utf-8');
  24. const ast = babylon.parse(content, {
  25. sourceType: 'module',
  26. });
  27. // 保存模块依赖的模块相对路径.
  28. const dependencies = [];
  29. // 我们遍历`ast`来试着理解这个模块依赖哪些模块.
  30. // 要做到这一点,我们检查`ast`中的每个 `import` 声明. ❤️
  31. traverse(ast, {
  32. // `Ecmascript`模块相当简单,因为它们是静态的. 这意味着你不能`import`一个变量,
  33. // 或者有条件地`import`另一个模块.
  34. // 每次我们看到`import`声明时,我们都可以将其数值视为`依赖性`.
  35. ImportDeclaration: ({
  36. node
  37. }) => {
  38. // import key from value; 拿到当前文件依赖的另一个文件路径
  39. dependencies.push(node.source.value);
  40. },
  41. });
  42. // 每读取到一个文件,就自增id维护
  43. const id = ID++;
  44. // `babel-preset-env``将代码转换为浏览器可以运行的东西.
  45. const {
  46. code
  47. } = transformFromAst(ast, null, {
  48. presets: ['env'],
  49. });
  50. // 返回有关此模块的所有信息.
  51. return {
  52. id,
  53. filename,
  54. dependencies,
  55. code,
  56. };
  57. }
  58. /********
  59. * 1、传入entry文件 得到文件信息,根据entry的依赖dfs遍历得到graph
  60. * 单独文件的信息:
  61. * {id,filename,dependencies,code}
  62. * 构建过程中,不断维护 mapping字段
  63. */
  64. function createGraph(entry) {
  65. const mainAsset = createAsset(entry);
  66. const queue = [mainAsset];
  67. for (const asset of queue) {
  68. // 我们的每一个 资产 都有它所依赖模块的相对路径列表.
  69. // 我们将重复它们,用我们的`createAsset() `函数解析它们,并跟踪此模块在此对象中的依赖关系.
  70. asset.mapping = {};
  71. // 记录filename的作用:和dependencies里的相对路径 拼凑成绝对路径
  72. const dirname = path.dirname(asset.filename);
  73. // 我们遍历其相关路径的列表
  74. asset.dependencies.forEach(relativePath => {
  75. const absolutePath = path.join(dirname, relativePath);
  76. // 每次解析dependencies读取一个文件 就产生一个模块备份
  77. // 同时维护relativePath对应的全局id
  78. const child = createAsset(absolutePath);
  79. asset.mapping[relativePath] = child.id;
  80. // 典型的DFS
  81. queue.push(child);
  82. });
  83. }
  84. return queue;
  85. }
  86. function bundle(graph) {
  87. let modules = '';
  88. graph.forEach(mod => {
  89. modules += `${mod.id}: [
  90. function (require, module, exports) { ${mod.code} },
  91. ${JSON.stringify(mod.mapping)},
  92. ],`;
  93. });
  94. const result = `
  95. (function(modules) {
  96. function require(id) { //🌟
  97. const [fn, mapping] = modules[id];
  98. function localRequire(name) { //⏰
  99. return require(mapping[name]); //🌟
  100. }
  101. const module = { exports : {} };
  102. fn(localRequire, module, module.exports);
  103. return module.exports;
  104. }
  105. require(0);
  106. })({${modules}})
  107. `;
  108. return result;// 返回字符串 写入bundlejs文件
  109. }
  110. const graph = createGraph('./example/index.js');
  111. const result = bundle(graph);
  112. function getFilePath(filename) {
  113. const processDir = process.cwd(); // 当前进程执行目录
  114. const createDir = path.resolve(processDir); // path 从右到左依次处理,直到构造出绝对路径。
  115. const filePath = path.join(createDir, filename);
  116. return filePath;
  117. }
  118. // fs.writeFileSync(getFilePath('dist/graph.json'), JSON.stringify(graph));
  119. // fs.writeFileSync(getFilePath('dist/bundle.js'), result);

优化:不重复打包

引申:ES6模块机制

语雀内容

优化:异步加载的支持

Amd实现原理

requiejs 异步加载(如何动态加载的?如何避免多次加载的?如何 缓存的?)

  1. define(["./a", "./b"], function(a, b) {
  2. // 依赖必须一开始就写好
  3. a.doSomething();
  4. // 此处略去 100 行
  5. b.doSomething();
  6. // ...
  7. });

require.js 的核心原理是通过动态创建 script 脚本来异步引入模块,然后对每个脚本的 load 事件进行监听,如果每个脚本都加载完成了,再调用回调函数。