第1章 类型

大多数开发者认为,像JavaScript这样的动态语言是没有类型(type)的。让我们来看看ES5.1规范(http://www.ecma-international.org/ecma-262/5.1/)对此是如何界定的:

本规范中的运算法则所操纵的值均有相应的类型。本节中定义了所有可能出现的类型。ECMAScript类型又进一步细分为语言类型和规范类型。

ECMAScript语言中所有的值都有一个对应的语言类型。ECMAScript语言类型包括Undefined、Null、Boolean、String、Number和Object。

喜欢强类型(又称静态类型)语言的人也许会认为“类型”一词用在这里不妥。“类型”在强类型语言中的涵义要广很多。

也有人认为,JavaScript中的“类型”应该称为“标签”(tag)或者“子类型”(subtype)。

本书中,我们这样来定义“类型”(与规范类似):对语言引擎和开发人员来说,类型是值的内部特征,它定义了值的行为,以使其区别于其他值。

换句话说,如果语言引擎和开发人员对42(数字)和"42"(字符串)采取不同的处理方式,那就说明它们是不同的类型,一个是number,一个是string。通常我们对数字42进行数学运算,而对字符串"42"进行字符串操作,比如输出到页面。它们是不同的类型。

上述定义并非完美,不过对于本书已经足够,也和JavaScript语言对自身的描述一致。

1.1 类型

撇开学术界对类型定义的分歧,为什么说JavaScript是否有类型也很重要呢?

要正确合理地进行类型转换(参见第4章),我们必须掌握JavaScript中的各个类型及其内在行为。几乎所有的JavaScript程序都会涉及某种形式的强制类型转换,处理这些情况时我们需要有充分的把握和自信。

如果要将42作为string来处理,比如获得其中第二个字符"2",就需要将它从number(强制类型)转换为string。

这看似简单,但是强制类型转换形式多样。有些方式简明易懂,也很安全,然而稍不留神,就会出现意想不到的结果。

强制类型转换是JavaScript开发人员最头疼的问题之一,它常被诟病为语言设计上的一个缺陷,太危险,应该束之高阁。

全面掌握JavaScript的类型之后,我们旨在改变对强制类型转换的成见,看到它的好处并且意识到它的缺点被过分夸大了。现在先让我们来深入了解一下值和类型。

1.2 内置类型

JavaScript有七种内置类型:

• 空值(null)

• 未定义(undefined)

• 布尔值(boolean)

• 数字(number)

• 字符串(string)

• 对象(object)

• 符号(symbol, ES6中新增)

除对象之外,其他统称为“基本类型”。

我们可以用typeof运算符来查看值的类型,它返回的是类型的字符串值。有意思的是,这七种类型和它们的字符串值并不一一对应:

        typeof undefined     === "undefined"; // true
        typeof true          === "boolean";   // true
        typeof 42            === "number";    // true
        typeof "42"          === "string";    // true
        typeof { life: 42 }  === "object";    // true

        // ES6中新加入的类型
        typeof Symbol()      === "symbol";    // true

以上六种类型均有同名的字符串值与之对应。符号是ES6中新加入的类型,我们将在第3章中介绍。

你可能注意到null类型不在此列。它比较特殊,typeof对它的处理有问题:

        typeof null === "object"; // true

正确的返回结果应该是"null",但这个bug由来已久,在JavaScript中已经存在了将近二十年,也许永远也不会修复,因为这牵涉到太多的Web系统,“修复”它会产生更多的bug,令许多系统无法正常工作。

我们需要使用复合条件来检测null值的类型:

        var a = null;

        (! a && typeof a === "object"); // true

null是“假值”(falsy或者false-like,参见第4章),也是唯一一个用typeof检测会返回"object"的基本类型值。

还有一种情况:

        typeof function a(){ /* .. */ } === "function"; // true

这样看来,function(函数)也是JavaScript的一个内置类型。然而查阅规范就会知道,它实际上是object的一个“子类型”。具体来说,函数是“可调用对象”,它有一个内部属性[[Call]],该属性使其可以被调用。

函数不仅是对象,还可以拥有属性。例如:

        function a(b, c) {
            /* .. */
        }

函数对象的length属性是其声明的参数的个数:

        a.length; // 2

因为该函数声明了两个命名参数,b和c,所以其length值为2。

再来看看数组。JavaScript支持数组,那么它是否也是一个特殊类型?

        typeof [1,2,3] === "object"; // true

不,数组也是对象。确切地说,它也是object的一个“子类型”(参见第3章),数组的元素按数字顺序来进行索引(而非像普通对象那样通过字符串键值),其length属性是元素的个数。

1.3 值和类型

JavaScript中的变量是没有类型的,只有值才有。变量可以随时持有任何类型的值。

换个角度来理解就是,JavaScript不做“类型强制”;也就是说,语言引擎不要求变量总是持有与其初始值同类型的值。一个变量可以现在被赋值为字符串类型值,随后又被赋值为数字类型值。

42的类型为number,并且无法更改。而"42"的类型为string。数字42可以通过强制类型转换(coercion)为字符串"42"(参见第4章)。

在对变量执行typeof操作时,得到的结果并不是该变量的类型,而是该变量持有的值的类型,因为JavaScript中的变量没有类型。

        var a = 42;
        typeof a; // "number"

        a = true;
        typeof a; // "boolean"

typeof运算符总是会返回一个字符串:

        typeof typeof 42; // "string"

typeof 42首先返回字符串"number",然后typeof "number"返回"string"。

1.3.1 undefined和undeclared

变量在未持有值的时候为undefined。此时typeof返回"undefined":

        var a;

        typeof a; // "undefined"

        var b = 42;
        var c;

        // later
        b = c;

        typeof b; // "undefined"
        typeof c; // "undefined"

大多数开发者倾向于将undefined等同于undeclared(未声明),但在JavaScript中它们完全是两回事。

已在作用域中声明但还没有赋值的变量,是undefined的。相反,还没有在作用域中声明过的变量,是undeclared的。

例如:

        var a;

        a; // undefined
        b; // ReferenceError: b is not defined

浏览器对这类情况的处理很让人抓狂。上例中,“b is not defined”容易让人误以为是“b is undefined”。这里再强调一遍,“undefined”和“is not defined”是两码事。此时如果浏览器报错成“b is not found”或者“b is not declared”会更准确。

更让人抓狂的是typeof处理undeclared变量的方式。例如:

        var a;

        typeof a; // "undefined"

        typeof b; // "undefined"

对于undeclared(或者not defined)变量,typeof照样返回"undefined"。请注意虽然b是一个undeclared变量,但typeof b并没有报错。这是因为typeof有一个特殊的安全防范机制。

此时typeof如果能返回undeclared(而非undefined)的话,情况会好很多。

1.3.2 typeof Undeclared

该安全防范机制对在浏览器中运行的JavaScript代码来说还是很有帮助的,因为多个脚本文件会在共享的全局命名空间中加载变量。

很多开发人员认为全局命名空间中不应该有变量存在,所有东西都应该被封装到模块和私有/独立的命名空间中。理论上这样没错,却不切实际。然而这仍不失为一个值得为之努力奋斗的目标。好在ES6中加入了对模块的支持,这使我们又向目标迈近了一步。

举个简单的例子,在程序中使用全局变量DEBUG作为“调试模式”的开关。在输出调试信息到控制台之前,我们会检查DEBUG变量是否已被声明。顶层的全局变量声明var DEBUG =true只在debug.js文件中才有,而该文件只在开发和测试时才被加载到浏览器,在生产环境中不予加载。

问题是如何在程序中检查全局变量DEBUG才不会出现ReferenceError错误。这时typeof的安全防范机制就成了我们的好帮手:

        // 这样会抛出错误
        if (DEBUG) {
            console.log( "Debugging is starting" );
        }

        // 这样是安全的
        if (typeof DEBUG ! == "undefined") {
            console.log( "Debugging is starting" );
        }

这不仅对用户定义的变量(比如DEBUG)有用,对内建的API也有帮助:

        if (typeof atob === "undefined") {
            atob = function() { /*..*/ };
        }

如果要为某个缺失的功能写polyfill(即衬垫代码或者补充代码,用来补充当前运行环境中缺失的功能),一般不会用var atob来声明变量atob。如果在if语句中使用var atob,声明会被提升(hoisted,参见《你不知道的JavaScript(上卷)》注1:此书已由人民邮电出版社出版。——编者注中的“作用域和闭包”部分)到作用域(即当前脚本或函数的作用域)的最顶层,即使if条件不成立也是如此(因为atob全局变量已经存在)。在有些浏览器中,对于一些特殊的内建全局变量(通常称为“宿主对象”, host object),这样的重复声明会报错。去掉var则可以防止声明被提升。

还有一种不用通过typeof的安全防范机制的方法,就是检查所有全局变量是否是全局对象的属性,浏览器中的全局对象是window。所以前面的例子也可以这样来实现:

        if (window.DEBUG) {
            // ..
        }

        if (! window.atob) {
            // ..
        }

与undeclared变量不同,访问不存在的对象属性(甚至是在全局对象window上)不会产生ReferenceError错误。

一些开发人员不喜欢通过window来访问全局对象,尤其当代码需要运行在多种JavaScript环境中时(不仅仅是浏览器,还有服务器端,如node.js等),因为此时全局对象并非总是window。

从技术角度来说,typeof的安全防范机制对于非全局变量也很管用,虽然这种情况并不多见,也有一些开发人员不大愿意这样做。如果想让别人在他们的程序或模块中复制粘贴你的代码,就需要检查你用到的变量是否已经在宿主程序中定义过:

        function doSomethingCool() {
            var helper =
              (typeof FeatureXYZ ! == "undefined") ?
              FeatureXYZ :
              function() { /*.. default feature ..*/ };

            var val = helper();
            // ..
        }

其他模块和程序引入doSomethingCool()时,doSomethingCool()会检查FeatureXYZ变量是否已经在宿主程序中定义过;如果是,就用现成的,否则就自己定义:

        // 一个立即执行函数表达式(IIFE,参见《你不知道的JavaScript(上卷)》“作用域和闭包”
        // 部分的3.3.2节)
        (function(){
            function FeatureXYZ() { /*.. my XYZ feature ..*/ }

            // 包含doSomethingCool(..)
            function doSomethingCool() {
              var helper =
                  (typeof FeatureXYZ ! == "undefined") ?
                  FeatureXYZ :
                  function() { /*.. default feature ..*/ };

              var val = helper();
              // ..
            }

            doSomethingCool();
        })();

这里,FeatureXYZ并不是一个全局变量,但我们还是可以使用typeof的安全防范机制来做检查,因为这里没有全局对象可用(像前面提到的window.)。

还有一些人喜欢使用“依赖注入”(dependency injection)设计模式,就是将依赖通过参数显式地传递到函数中,如:

        function doSomethingCool(FeatureXYZ) {
            var helper = FeatureXYZ ||
              function() { /*.. default feature ..*/ };
            var val = helper();
            // ..
        }

上述种种选择和方法各有利弊。好在typeof的安全防范机制为我们提供了更多选择。

1.4 小结

JavaScript有七种内置类型:null、undefined、boolean、number、string、object和symbol,可以使用typeof运算符来查看。

变量没有类型,但它们持有的值有类型。类型定义了值的行为特征。

很多开发人员将undefined和undeclared混为一谈,但在JavaScript中它们是两码事。undefined是值的一种。undeclared则表示变量还没有被声明过。

遗憾的是,JavaScript却将它们混为一谈,在我们试图访问"undeclared"变量时这样报错:ReferenceError: a is not defined,并且typeof对undefined和undeclared变量都返回"undefined"。

然而,通过typeof的安全防范机制(阻止报错)来检查undeclared变量,有时是个不错的办法。