3.2 如何选择数据类型

MySQL提供了大量的数据类型,为了优化存储、提高数据库性能,在任何情况下均应使用最精确的类型,即在所有可以表示该字段值的类型中选择占用存储空间最少的类型。

1. 整数类型和浮点数类型

如果不需要小数部分,则使用整数来保存数据;如果需要表示小数部分,则使用浮点数类型。对于定义为浮点数据的字段,存入该字段的数值会根据该字段定义的小数位数进行四舍五入。例如,字段的取值范围为1~99999,若使用整数,则MEDIUMINT UNSIGNED是最好的类型;若需要存储小数,则使用FLOAT类型。

浮点类型包括FLOAT和DOUBLE类型。DOUBLE类型的精度比FLOAT类型的精度高,因此要求存储精度较高时,应选择DOUBLE类型。

2. 浮点数类型和定点数类型

浮点数FLOAT、DOUBLE相对于定点数DECIMAL的优势是:在长度一定的情况下,浮点数能表示更大范围的数据。但是,由于浮点数容易产生误差,因此对精确度要求比较高时,建议使用DECIMAL来存储。DECIMAL在MySQL中是以字符串方式来存储的,用于定义货币等对精确度要求较高的数据。在数据迁移中,float(M,D)是非标准的SQL定义,数据库迁移可能会出现问题,最好不要这样使用。另外,两个浮点数进行减法和比较运算时也容易出问题,因此在使用浮点数进行算术和比较运算时一定要注意。如果进行数值的比较,最好使用DECIMAL类型。

3. 日期与时间类型

MySQL有很多不同种类的日期和时间数据类型,比如YEAR和TIME。如果只需要记录年份,则使用YEAR类型即可;如果只记录时间,则只需使用TIME类型。

如果同时需要记录日期和时间,则可以使用TIMESTAMP或者DATETIME类型。由于TIMESTAMP的取值范围小于DATETIME的取值范围,因此需要保存范围较大的日期和时间值时最好使用DATETIME。

TIMESTAMP类型也有一个DATETIME类型不具备的属性。在默认的情况下,当插入一条记录但并没有指定TIMESTAMP值时,MySQL会把定义为TIMESTAMP字段的值设为系统当前的日期和时间。因此,当需要插入记录的同时插入系统当前的日期和时间值时,选择TIMESTAMP类型就很方便。

4. CHAR类型与VARCHAR类型之间的特点与选择

CHAR类型和VARCHAR类型的区别如下:

  • CHAR用于定义固定长度的字符串,VARCHAR用于定义可变长度的字符串。
  • CHAR会自动删除字符串尾部的空格,VARCHAR不会删除尾部空格。

CHAR因为是固定长度,所以它的处理速度比VARCHAR的速度要快,但是它的缺点是浪费存储空间。因此,对总体存储空间不大但在速度上有要求的使用场合就可以使用CHAR类型,反之可以使用VARCHAR类型。

存储引擎对于选择CHAR和VARCHAR的影响:

  • 对于MyISAM存储引擎:最好使用固定长度的数据字段代替可变长度的数据字段。这样可以使整个表静态化,从而使数据检索更快,用空间换时间。
  • 对于InnoDB存储引擎:使用可变长度的数据字段,因为InnoDB数据表的存储格式不分固定长度和可变长度,所以使用CHAR不一定比使用VARCHAR更好。另外,由于VARCHAR是按照实际的长度存储数据,比较节省空间,因此对磁盘I/O和数据存储总量比较好。
5. ENUM类型和SET类型

ENUM类型只能取单值,它的数据列表是一个枚举集合。它的合法取值列表最多允许有65 535个成员。因此,在需要从多个值中选取一个时,可以使用ENUM类型。比如:性别字段适合定义为ENUM类型,每次只能从'男'或'女'中取一个值。

SET类型可取多值,它的合法取值列表最多允许有64个成员。空字符串也是一个合法的SET值。在需要取多个值的时候,适合使用SET类型。比如:要存储一个人的兴趣爱好,最好使用SET类型。

ENUM类型和SET类型的值是以字符串形式出现的,但在数据库内部,MySQL以数值的形式存储它们的。

6. BLOB类型和TEXT类型

BLOB类型是二进制字符串类型,TEXT是非二进制字符串类型,两者均可存放大容量的信息。BLOB主要存储图片、音频信息等,而TEXT只能存储纯文本信息。