mysql> create table class(
-> id int primary key auto_increment,
-> name varchar(10) not null default '',
-> gender char(1) not null default '',
-> company varchar(20) not null default '',
-> salary decimal(6,2) not null default 0.00
-> )engine myisam charset utf8;
上述语句声明了字段的名称、类型、所占空间、默认值 和是否可以为空等信息。其中的 int、varchar、char 和 decimal 都是 MySQL 所支持的数据类型,本节将详细介绍 MySQL 支持的数据类型。
MySQL 中定义数据字段的类型对数据库的优化非常重要。MySQL中的每种数据类型都可以通过以下特征来确定:
MySQL 支持的数据类型可以分为三类:数值、日期/时间和字符串(字符)类型,另外还有空间数据类型和JSON数据类型,本节以前三种数据类型为主,最后两种简单介绍一下。
MySQL支持所有标准SQL数值数据类型。
这些类型包括严格数值数据类型(INTEGER、SMALLINT、DECIMAL和NUMERIC),以及近似数值数据类型(FLOAT、REAL和DOUBLE PRECISION)。
关键字INT是INTEGER的同义词,关键字DEC是DECIMAL的同义词。
作为SQL标准的扩展,MySQL也支持整数类型TINYINT、MEDIUMINT和BIGINT。下面的表显示了需要的每个整数类型的存储和范围。
类型 | 大小 | 范围(有符号) | 范围(无符号) | 用途 |
---|---|---|---|---|
TINYINT | 1 字节 | (-128,127) | (0,255) | 小整数值 |
SMALLINT | 2 字节 | (-32 768,32 767) | (0,65 535) | 大整数值 |
MEDIUMINT | 3 字节 | (-8 388 608,8 388 607) | (0,16 777 215) | 大整数值 |
INT或INTEGER | 4 字节 | (-2 147 483 648,2 147 483 647) | (0,4 294 967 295) | 大整数值 |
BIGINT | 8 字节 | (-9 233 372 036 854 775 808,9 223 372 036 854 775 807) | (0,18 446 744 073 709 551 615) | 极大整数值 |
FLOAT | 4 字节 | (-3.402 823 466 E+38,1.175 494 351 E-38),0,(1.175 494 351 E-38,3.402 823 466 351 E+38) | 0,(1.175 494 351 E-38,3.402 823 466 E+38) | 单精度 浮点数值 |
DOUBLE | 8 字节 | (1.797 693 134 862 315 7 E+308,2.225 073 858 507 201 4 E-308),0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) | 0,(2.225 073 858 507 201 4 E-308,1.797 693 134 862 315 7 E+308) | 双精度 浮点数值 |
DECIMAL | 对DECIMAL(M,D) ,如果M>D,为M+2否则为D+2 | 依赖于M和D的值 | 依赖于M和D的值 | 小数值 |
以 TINYINT 为例详细介绍整形数值型的一些属性及操作。
TINYINT[(M)][UNSIGNED][ZEROFILL]
M表示每个值的位数,此处为显示的位数,并不是占用字节大小。该可选显示宽度规定用于显示宽度小于指定的列宽度的值时从左侧填满宽度。当结合可选扩展属性ZEROFILL使用时, 默认补充的空格用零代替。例如,对于声明为INT(5) ZEROFILL的列,值5检索为00005。
注意:M 要与 ZEROFILL 配合使用才有效果。
如果一个数值列指定为 ZEROFILL, MySQL自动为该列添加 UNSIGNED 属性。
mysql> create database datatype;
Query OK, 1 row affected (0.03 sec)
mysql> use datatype;
Database changed
mysql> show tables;
Empty set (0.00 sec)
mysql> create table int_type(
-> id TINYINT not null default 0,
-> age TINYINT(4) not null default 0,
-> distance TINYINT(4) ZEROFILL not null default 0,
-> score TINYINT UNSIGNED not null default 0,
-> ranking TINYINT ZEROFILL not null default 0
-> )engine myisam charset utf8;
Query OK, 0 rows affected, 1 warning (0.06 sec)
mysql> desc int_type;
+----------+------------------------------+------+-----+---------+-------+
| Field | Type | Null | Key | Default | Extra |
+----------+------------------------------+------+-----+---------+-------+
| id | tinyint(4) | NO | | 0 | |
| age | tinyint(4) | NO | | 0 | |
| distance | tinyint(4) unsigned zerofill | NO | | 0000 | |
| score | tinyint(3) unsigned | NO | | 0 | |
| ranking | tinyint(3) unsigned zerofill | NO | | 000 | |
+----------+------------------------------+------+-----+---------+-------+
5 rows in set (0.00 sec)
对于浮点列类型,在MySQL中单精度值使用4个字节,双精度值使用8个字节。
DOUBLE[(M,D)][UNSIGNED][ZEROFILL]
MySQL 没有内置的 BOOLEAN 或 BOOL 数据类型,使用最小的整数类型,也就是 TINYINT(1) 来表示。
表示时间值的日期和时间类型为 DATETIME、DATE、TIMESTAMP、TIME 和 YEAR。
每个时间类型有一个有效值范围和一个"零"值,当指定不合法的MySQL不能表示的值时使用"零"值。
TIMESTAMP 类型有专有的自动更新特性,将在后面描述。
类型 | 大小 (字节) | 范围 | 格式 | 描述 |
---|---|---|---|---|
DATE | 3 | 1000-01-01/9999-12-31 | YYYY-MM-DD | 日期值 |
TIME | 3 | ‘-838:59:59’/‘838:59:59’ | HH:MM:SS | 时间值或持续时间 |
YEAR | 1 | 1901/2155 | YYYY | 年份值 |
DATETIME | 8 | 1000-01-01 00:00:00/9999-12-31 23:59:59 | YYYY-MM-DD HH:MM:SS | 混合日期和时间值 |
TIMESTAMP | 4 | 1970-01-01 00:00:00/2038结束时间是第 2147483647 秒,北京时间 2038-1-19 11:14:07,格林尼治时间 2038年1月19日 凌晨 03:14:07 | YYYYMMDD HHMMSS | 混合日期和时间值,时间戳 |
注意:
在MySQL中,字符串可以容纳从纯文本到二进制数据(如图像或文件)的任何内容。 字符串类型指 CHAR、VARCHAR、BINARY、VARBINARY、BLOB、TEXT、ENUM和SET。
类型 | 大小 | 描述 |
---|---|---|
CHAR | 0-255字节 | 定长字符串 |
VARCHAR | 0-65535 字节 | 变长字符串 |
TINYBLOB | 0-255字节 | 不超过 255 个字符的二进制字符串 |
TINYTEXT | 0-255字节 | 短文本字符串 |
BLOB | 0-65 535字节 | 二进制形式的长文本数据 |
TEXT | 0-65 535字节 | 长文本数据 |
MEDIUMBLOB | 0-16 777 215字节 | 二进制形式的中等长度文本数据 |
MEDIUMTEXT | 0-16 777 215字节 | 中等长度文本数据 |
LONGBLOB | 0-4 294 967 295字节 | 二进制形式的极大文本数据 |
LONGTEXT | 0-4 294 967 295字节 | 极大文本数据 |
CHAR 和 VARCHAR 类型类似,但它们保存和检索的方式不同。它们的最大长度和是否尾部空格被保留等方面也不同。在存储或检索过程中不进行大小写转换。
CHAR和VARCHAR类型声明时需要一个长度值,该值表示你想要想要存储的字符的最大数量。例如,CHAR(30)可以容纳30个字符。 CHAR 列的宽度在创建表时已经固定下来了,如果插入记录该字段的宽度不足指定宽度,那么要在右侧自动填补 空格。检索CHAR值时,除非启用 PAD_CHAR_TO_FULL_LENGTH
SQL模式,否则将删除尾部空格。
存储 VARCHAR 值时,不会填充。在与标准SQL一致的情况下,存储和检索值时保留尾部空格。
下表展示了CHAR和VARCHAR之间的差异,它展示了将各种字符串值存储到CHAR(4)和VARCHAR(4)列的结果(假设此列使用了一个单字节字符集,如latin1)。
Value | CHAR(4) | Storage Required | VARCHAR(4) | Storage Required |
---|---|---|---|---|
'' | ' ' | 4 bytes | '' | 1 byte |
'ab' | 'ab ' | 4 bytes | 'ab' | 3 bytes |
'abcd' | 'abcd' | 4 bytes | 'abcd' | 5 bytes |
'abcdefgh' | 'abcd' | 4 bytes | 'abcd' | 5 bytes |
请看下面例子:
BINARY 和 VARBINARY 类似于 CHAR 和 VARCHAR,不同的是它们包含二进制字符串而不要非二进制字符串。也就是说,它们包含字节字符串而不是字符字符串。这说明它们没有字符集,并且排序和比较基于列值字节的数值。
BLOB 是一个二进制大对象,可以容纳可变数量的数据。有 4 种 BLOB 类型:TINYBLOB、BLOB、MEDIUMBLOB 和 LONGBLOB。它们区别在于可容纳存储范围不同。四种 TEXT 类型是TINYTEXT、TEXT、MEDIUMTEXT 和 LONGTEXT。它们对应于四个 BLOB 类型,并且具有相同的最大长度和存储要求。
ENUM 是一个字符串对象,它从一个允许值列表中选择了一个值,这些值在表创建时显式地列出了列规范中。它有这些优势:
枚举值必须是引用的字符串文字。 你可以这样用枚举列创建表:
mysql> create table shirts (
-> name varchar(40),
-> size enum('x-small', 'small', 'medium', 'large')
-> );
Query OK, 0 rows affected (0.10 sec)
mysql> insert into shirts
-> (name, size)
-> values
-> ('dress shirt', 'large'),
-> ('t-shirt', 'medium'),
-> ('polo shirt', 'small');
Query OK, 3 rows affected (0.04 sec)
Records: 3 Duplicates: 0 Warnings: 0
mysql> select name, size from shirts where size = 'large';
+-------------+-------+
| name | size |
+-------------+-------+
| dress shirt | large |
+-------------+-------+
1 row in set (0.00 sec)
假如向该表中插入一百万条 值为 'medium'
的记录,存储空间需要一百万字节。相比而言,如果以字符串 'medium'
存储,则需要六百万字节。
SET 是一个字符串对象,可以有0个或多个值,并且每一个值都必须从表创建时指定的允许值列表中选择。SET 的列值由多个集合成员组成的,用逗号(,)分隔。这样的话,SET成员值本身不应该包含逗号。
例如,由 SET('one', 'two') NOT NULL
指定的数据列可以有这些值:
''
'one'
'two'
'one,two'
SET
列最多可以包含64个不同的成员。
看如下例子:
mysql> INSERT INTO myset (col) VALUES
-> ('a,d'), ('d,a'), ('a,d,a'), ('a,d,d'), ('d,a,d');
Query OK, 5 rows affected (0.09 sec)
Records: 5 Duplicates: 0 Warnings: 0
mysql> select col from myset;
+------+
| col |
+------+
| a,d |
| a,d |
| a,d |
| a,d |
| a,d |
+------+
5 rows in set (0.00 sec)
从查询结果可以看出:如果一条记录里已经包含 SET 的一个成员了,就不会重复保存该值。
MySQL支持许多包含各种几何和地理值的空间数据类型,如下表所示:
类型 | 描述 |
---|---|
GEOMETRY | 任何类型的空间值 |
POINT | 一个点(一对X-Y坐标) |
LINESTRING | 曲线(一个或多个POINT 值) |
POLYGON | 多边形 |
GEOMETRYCOLLECTION | GEOMETRY 值的集合 |
MULTILINESTRING | LINESTRING 值的集合 |
MULTIPOINT | POINT 值的集合 |
MULTIPOLYGON | POLYGON 值的集合 |
MySQL 支持由 RFC 7159 规定的原生 JSON
数据类型,以更有效地存储和管理JSON文档。 本机JSON数据类型提供JSON文档的自动验证和最佳存储格式。 JSON 列不能有默认值。
mysql> CREATE TABLE myjson (jdoc JSON);
Query OK, 0 rows affected (0.13 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('{"key1": "value1", "key2": "value2"}');
Query OK, 1 row affected (0.03 sec)
mysql> SELECT jdoc FROM myjson;
+--------------------------------------+
| jdoc |
+--------------------------------------+
| {"key1": "value1", "key2": "value2"} |
+--------------------------------------+
1 row in set (0.00 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('[1, 2');
ERROR 3140 (22032): Invalid JSON text: "Missing a comma or ']' after an array element." at position 5 in value for column 'myjson.jdoc'.
可以看到,如果我们插入的记录 JSON 数据格式不正确是不能成功的。
类型 | 描述 |
---|---|
GEOMETRY | 任何类型的空间值 |
POINT | 一个点(一对X-Y坐标) |
LINESTRING | 曲线(一个或多个POINT 值) |
POLYGON | 多边形 |
GEOMETRYCOLLECTION | GEOMETRY 值的集合 |
MULTILINESTRING | LINESTRING 值的集合 |
MULTIPOINT | POINT 值的集合 |
MULTIPOLYGON | POLYGON 值的集合 |
MySQL 支持由 RFC 7159? 规定的原生?JSON
?数据类型,以更有效地存储和管理JSON文档。 本机JSON数据类型提供JSON文档的自动验证和最佳存储格式。 JSON 列不能有默认值。
mysql> CREATE TABLE myjson (jdoc JSON);
Query OK, 0 rows affected (0.13 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('{"key1": "value1", "key2": "value2"}');
Query OK, 1 row affected (0.03 sec)
mysql> SELECT jdoc FROM myjson;
+--------------------------------------+
| jdoc |
+--------------------------------------+
| {"key1": "value1", "key2": "value2"} |
+--------------------------------------+
1 row in set (0.00 sec)
mysql> INSERT INTO myjson
-> VALUES
-> ('[1, 2');
ERROR 3140 (22032): Invalid JSON text: "Missing a comma or ']' after an array element." at position 5 in value for column 'myjson.jdoc'.
可以看到,如果我们插入的记录 JSON 数据格式不正确是不能成功的。