1.什么是模块化、模块化开发?
- 事实上模块化开发最终的目的是将程序划分成一个个小的结构;
- 这个结构中编写属于自己的逻辑代码,有自己的作用域,不会影响到其他的结构;
- 这个结构可以将自己希望暴露的变量、函数、对象等导出给其结构使用;
- 也可以通过某种方式,导入另外结构中的变量、函数、对象等;
上面说提到的 结构 ,就是 模块 ;按照这种 结构划分 开发程序的过程,就是 模块化开发 的过程;
2.JavaScript模块化的历史
在网页开发的早期, Brendan Eich 开发JavaScript仅仅作为一种 脚本语言 ,做一些简单的表单验证或动画实现等,那个时候代码还是很少的:
- 这个时候我们只需要讲JavaScript代码写到<script>标签中即可;
- 并没有必要放到多个文件中来编写;甚至流行:通常来说 JavaScript 程序的长度只有一行。
但是随着前端和JavaScript的快速发展,JavaScript代码变得越来越复杂了:
- ajax的出现,前后端开发分离,意味着后端返回数据后,我们需要通过JavaScript进行前端页面的渲染;
- SPA的出现,前端页面变得更加复杂:包括前端路由、状态管理等等一系列复杂的需求需要通过JavaScript来实现;
- 包括Node的实现,JavaScript编写复杂的后端程序,没有模块化是致命的硬伤;
所以,模块化已经是JavaScript一个非常迫切的需求: 但是JavaScript本身,直到 ES6 (2015)才推出了自己的模块化方案; 在此之前,为了让JavaScript支持模块化,涌现出了很多不同的模块化规范: AMD、CMD、CommonJS 等。
3.没有模块化带来的问题
早期没有模块化带来了很多的问题:比如 命名冲突 的问题
当然,我们有办法可以解决上面的问题:立即函数调用表达式(IIFE)
IIFE (Immediately Invoked Function Expression)
但是,我们其实带来了新的问题:
- 第一,我必须记得每一个模块中返回对象的命名,才能在其他模块使用过程中正确的使用;
- 第二,代码写起来混乱不堪,每个文件中的代码都需要包裹在一个匿名函数中来编写;
- 第三,在没有合适的规范情况下,每个人、每个公司都可能会任意命名、甚至出现模块名称相同的情况;
所以,我们会发现,虽然实现了模块化,但是我们的实现过于简单,并且是没有规范的。
我们需要制定一定的规范来约束每个人都 按照这个规范去编写模块化的代码 ; 这个规范中应该包括核心功能: 模块本身可以导出暴露的属性,模块又可以导入自己需要的属性 ;
JavaScript社区为了解决上面的问题,涌现出 一系列好用的规范 ,接下来我们就学习具有代表性的一些规范。
4.CommonJs
exports和module.exports可以负责 对模块中的内容进行导出 ;
require函数可以帮助我们 导入其他模块(自定义模块、系统模块、第三方库模块)中的内容 ;
4.1 export和module.export导出
最终导出的是module.export对象,export是对module.export的引用,可以往export上面添加属性,但是不能直接给export赋值一个新对象,这样不能正确的导出。
javascript
// why.js
const name = "why"
const age = 18
let friend = {
name:'哈哈',
age:18
}
function sum(num1, num2) {
return num1 + num2
}
// 第一种导出方式
exports.name = name
exports.age = age
export.friend = friend
// 第二种导出方式
module.exports = {
name,age,friend
}
// 这种代码不会进行导出
exports = {
name,
age,
sum
}
// 最终能导出的一定是module.exports
4.2 require()导入
javascript
// main.js
const why = require("./why.js")
console.log(why.name)
console.log(why.age)
上面这行完成了什么操作呢?理解下面这句话,Node中的模块化一目了然
- 而在使用
require
导入模块时,实际上是将导出模块中的module.exports变量浅拷贝到当前模块的作用域中。 - 当不同的文件中使用
require
导入相同的模块时,它们实际上是拥有各自独立的模块实例,彼此之间不会共享模块中的变量。 - 当导出模块中的module.exports变量是基本数据类型时,源模块和导入模块修改这个变量不会互相影响。
javascript
// foo.js
setTimeout(() => {
module.exports = "我改了"
}, 1000)
module.exports = "我还没改"
// main.js
const foo = require("./foo.js")
console.log(foo) //我还没改
setTimeout(() => {
console.log(foo) //我还没改
}, 2000)
- 当导出模块中的module.exports变量是引用数据类型时,源模块和导入模块都指向同一个内存空间,修改了之后会互相影响
4.3 require()的查找规则
导入格式如下:require(X)
情况一 :X是一个Node核心模块,比如path、http ,直接返回核心模块,并且停止查找
情况二:X是以 ./ 或 ../ 或 /(根目录)开头的
第一步:将X当做一个文件在对应的目录下查找;
1.如果有后缀名,按照后缀名的格式查找对应的文件
2.如果没有后缀名,会按照如下顺序:
- 直接查找文件X
- 查找X.js文件
- 查找X.json文件
- 查找X.node文件
第二步:没有找到对应的文件,将X作为一个目录,查找目录下面的index文件
- 查找X/index.js文件
- 查找X/index.json文件
- 查找X/index.node文件
如果没有找到,那么报错:not found
情况三: 直接是一个X(没有路径),并且X不是一个核心模块
会现在当前目录的node_modules下查找是否有这个文件,如果没有找到则去上一级目录查找,如果找到了直接返回,没有找到再去上一级目录查找,直到找到根目录下的node_modules, 如果上面的路径中都没有找到,那么报错:not found
例如:
在这个目录的main.js文件中:
/Users/coderwhy/Desktop/Node/TestCode/04_learn_node/05_javascript-module/02_commonjs/main.js
编写 require('why')
查找的路径如下:
4.4 模块的加载过程
- 1.模块的加载是同步的
- **2.模块在被第一次引入时,**模块中的js代码会被运行一次
为什么只会加载运行一次呢?
这是因为每个模块对象module都有一个属性:loaded,为false表示还没有加载,为true表示已经加载;
- 3.模块被多次引入时,会缓存,最终只加载(运行)一次
- 4.如果有循环引入,那么加载顺序是****深度优先算法
如果出现上图模块的引用关系,那么加载顺序是什么呢?
- 这个其实是一种数据结构:图结构;
- 图结构在遍历的过程中,有深度优先搜索(DFS, depth first search)和广度优先搜索(BFS,breadth first search);
- Node采用的是深度优先算法:main -> aaa -> ccc -> ddd -> eee ->bbb
4.5 CommonJS规范缺点
CommonJS加载模块是 同步 的:
- 同步的意味着只有等到对应的模块加载完毕,当前模块中的内容才能被运行;
- 这个在服务器不会有什么问题,因为服务器加载的js文件都是本地文件,加载速度非常快;
如果将它应用于浏览器呢?
- 浏览器加载js文件需要先从服务器将文件下载下来,之后再加载运行;
- 那么采用同步的就意味着后续的js代码都无法正常运行,即使是一些简单的DOM操作;
所以在浏览器中,我们通常不使用CommonJS规范:
当然在webpack中使用CommonJS是另外一回事,因为它会将我们的代码转成浏览器可以直接执行的代码;
在早期为了可以 在浏览器中使用模块化,通常会采用AMD或CMD :
但是目前一方面现代的浏览器 已经支持ES Modules ,另一方面借助于webpack等工具可以 实现对CommonJS或者ES Module代码 的转换; AMD和CMD已经使用非常少 了
5.ES Module
ES Module模块采用 export 和 import 关键字来实现模块化:
- export负责将模块内的内容导出;
- import负责从其他模块导入内容;
另一方面它采用 编译期的静态分析 ,并且也加入了 动态引用 的方式;
5.1 exports导出关键字
export
命令规定的是对外的接口 ,必须与模块内部的变量建立一一对应关系。export
语句输出的接口,与其对应的值是动态绑定关系,通过该接口,可以取到模块内部实时的值,即当变量的值发生变化,接口的值也会实时的发生变化。
javascript
// foo.js
// 导出方式一:export 声明语句
export const name = "why"
export const age = 18
export function foo() {
console.log("foo function")
}
// 导出方式二:export 导出 和 声明分开
const name = "哈哈"
const age = "18"
export {name, age} //声明了对外的接口name,age,和模块内的变量一一对应
// 导出方式三: 第二种导出时起别名
export {
name as fName,
age as fAge,
foo as fFoo
}
// 导出方式四:默认导出,一个模块的默认导出只能有一个
export default name
最后,export
命令可以出现在模块的任何位置,只要处于模块顶层就可以。如果处于块级作用域内,就会报错,下一节的import
命令也是如此。这是因为处于条件代码块之中,就没法做静态优化了,违背了 ES6 模块的设计初衷。
javascript
function foo() {
export default 'bar' // SyntaxError
}
foo()
5.2 import 导入关键字
import
命令接受一对大括号,里面指定要从其他模块导入的变量名。大括号里面的变量名,必须与被导入模块(profile.js
)对外接口的名称相同。
javascript
// main.js
// 1.导入方式一: 普通的导入
import { name, age, foo } from "./foo.js"
import { fName, fAge, fFoo } from './foo.js'
// 2.导入方式二: 起别名
import { name as fName, age as fAge, foo as fFoo } from './foo.js'
// 3.导入方式三: 将导出的所有内容放到一个标识符中
import * as foo from './foo.js'
// 4.导入方式四:默认导入可以自己起名字
import myName from './foo.js'
import
命令输入的变量都是只读的,因为它的本质是输入接口。也就是说,不允许在加载模块的脚本里面,改写接口。
javascript
import {a} from './xxx.js'
a = {}; // Syntax Error : 'a' is read-only;
上面代码中,脚本加载了变量a
,对其重新赋值就会报错,因为a
是一个只读的接口。但是,如果a
是一个对象,改写a
的属性是允许的。
javascript
import {a} from './xxx.js'
a.foo = 'hello'; // 合法操作
上面代码中,a
的属性可以成功改写,并且其他模块也可以读到改写后的值。不过,这种写法很难查错,建议凡是输入的变量,都当作完全只读,不要轻易改变它的属性。
5.3 import和export混合使用
javascript
// 1.导出方式一:
import { add, sub } from './math.js'
import { timeFormat, priceFormat } from './format.js'
export {
add,
sub,
timeFormat,
priceFormat
}
// 2.导出方式二:
export { add, sub } from './math.js'
export { timeFormat, priceFormat } from './format.js'
// 3.导出方式三:
export * from './math.js'
export * from './format.js'
5.4 模块加载过程
import
命令会被 JavaScript 引擎静态分析,先于模块内的其他语句执行
当JavaScript引擎执行代码时,会在编译阶段对import
语句进行静态分析,确定所导入的模块,并在运行时加载这些模块。
在使用import
导入模块时,实际上是在模块内部创建了一个指向被导入模块的引用,而不是直接复制模块中的变量。因此,当不同的文件中使用import
导入相同的模块时,它们实际上是共享了同一个模块实例,所以可以访问和修改同一个模块中的变量。
JS 引擎对脚本静态分析的时候,遇到模块加载命令import
,就会生成一个只读引用 。等到脚本真正执行时,再根据这个只读引用,到被加载的那个模块里面去取值。原始值变了,import
加载的值也会跟着变。因此,ES6 模块是动态引用,并且不会缓存值,模块里面的变量绑定其所在的模块。
5.5 import() 函数实现动态加载
ES6的模块不是对象,import 命令会被 JavaScript 引擎静态分析,在编译时就引入模块代码,而不是在代码运行时加载,所以无法实现条件加载。也正因为这个,使得静态分析成为可能。
这样的设计,固然有利于编译器提高效率,但也导致无法在运行时加载模块。在语法上,条件加载就不可能实现。如果import
命令要取代 Node 的require
方法,这就形成了一个障碍。因为require
是运行时加载模块,import
命令无法取代require
的动态加载功能。
动态加载 ,require
到底加载哪一个模块,只有运行时才知道。
ES2020提案 引入import()
函数,支持动态加载模块。
javascript
import(specifier)
上面代码中,import
函数的参数specifier
,指定所要加载的模块的位置。import
命令能够接受什么参数,import()
函数就能接受什么参数,两者区别主要是后者为动态加载。
import()
函数可以用在任何地方,不仅仅是模块,非模块的脚本也可以使用。它是运行时执行,也就是说,什么时候运行到这一句,就会加载指定的模块。另外,import()
函数与所加载的模块没有静态连接关系,这点也是与import
语句不相同。import()
类似于 Node 的require
方法,区别主要是前者是异步加载,后者是同步加载。
import()
加载模块成功以后,这个模块会作为一个对象,当作then
方法的参数。因此,可以使用对象解构赋值的语法,获取输出接口。
javascript
import('./myModule.js')
.then(({export1, export2}) => {
// ...·
});
上面代码中,export1
和export2
都是myModule.js
的输出接口,可以解构获得。
如果模块有default
输出接口,可以用参数直接获得。
javascript
import('./myModule.js')
.then(myModule => {
console.log(myModule.default);
});
6.ES6 模块与 CommonJS 模块的差异
相同点:
只有在第一个导入的时候会执行源模块的代码,重复导入不会再执行
不同点:
- CommonJS 模块输出的是一个值的浅拷贝,ES6 模块输出的是值的引用。
- CommonJS 模块是运行时加载,ES6 模块是编译时输出接口。
7.AMD
这种方案采用 异步 加载的方式来加载模块,模块的加载不影响后面语句的执行,所有依赖这个模块的语句都定义在一个 回调函数里,等到加载完成后再执行回调函数。
require.js实现AMD规范的模块化:
用 require.config() 指定引用路径等,用 define() 定义模块,用 **require()**加载模块。
javascript
// main.js
// index.html 网页中引入require.js及main.js
<script src="js/require.js" data-main="js/main"></script>
// 首先用config()指定各模块路径和引用名
require.config({
baseUrl: './src',
paths: {
foo: "foo", // 实际路径为./src/foo
bar: "bar"
}
})
// 引用模块的时候,我们将模块名放在[ ]中作为requier()的第一参数
require(["foo", "bar"], function(foo) {
console.log("main:", foo)
})
javascript
// foo.js
define(function() {
const name = "why"
const age = 18
function sum(num1, num2) {
return num1 + num2
}
return {
name,
age,
sum
}
})
如果我们定义的模块本身也依赖其他模块,那就需要将它们放在[ ]中作为define()的第一参数。
javascript
// bar.js
define(["foo"], function(foo) {
console.log("bar:", foo)
const name = "bar"
return { name }
})
AMD 在依赖模块加载完成后就 直接执行依赖模块,依赖模块的执行顺序和我们书写的顺序不一定一致,并且即使在回调函数里面没有用到该模块,也会加载执行。
javascript
define(["a", "b", "c", "d", "e", "f"], function(a, b, c, d, e, f) {
// 等于在最前面声明并初始化了要用到的所有模块
if (false) {
// 即便没用到某个模块 b,但 b 还是提前执行了
b.foo()
}
});
8.CMD
这种方案采用 异步 加载的方式来加载模块, CMD 在依赖模块 加载完成后并不执行 ,只是下载而已,等到所有的依赖模块都加载好后,进入回调函数逻辑, 遇到 require 语句 的时候才执行对应的模块,这样模块的执行顺序就和我们书写的顺序保持一致了。
sea.js实现了 CMD 规范。它和require.js的区别在于对依赖模块的执行时机的处理不同。
javascript
// 定义模块 math.js
define(function(require, exports, module) {
var a = require('./a'); //遇到require语句时,才会执行对于模块的代码
a.doSomething();
if (false) {
var b = require('./b'); // 该语句不会执行,所以./b对应的模块也不会执行
b.doSomething();
}
let add = function(a,b){
return a+b;
}
exports.add = add; // 导出add
});
javascript
// 加载模块
seajs.use(['math.js'], function(math){
var sum = math.add(1+2);
});
参考: