MySQL UNION 的用法与实例
在本文中,我们讨论在 MySQL 中对两个结果集进行 UNION
运算,以及 UNION
运算的规则。
在 MySQL 中,UNION
操作符是一个集合操作符,它用于合并 2 个结果集中的所有的行。
SQL 标准中定义了 3 个集合操作符: UNION
, INTERSECT
和 MINUS
。目前 MySQL 只支持 UNION
。
UNION
操作符语法
UNION
操作符用来合并两个 SELECT
语句的结果集。UNION
操作符的语法如下:
SELECT statement
UNION [DISTINCT | ALL]
SELECT statement
说明:
UNION
双目操作符,需要两个SELECT
语句作为操作数。UNION
中的SELECT
语句中的列数、列顺序必须相同。UNION
运算包括UNION DISTINCT
和UNION ALL
两种算法,其中UNION DISTINCT
可以简写为UNION
。UNION DISTINCT
或UNION
将过滤掉结果集中重复记录。UNION ALL
将返回结果集中的所有记录。
UNION 实例
建立测试表和测试数据
在以下实例中,我们创建 a
和 b
两个表进行演示。
创建测试表并插入测试数据
CREATE TABLE a (v INT);
CREATE TABLE b (v INT);
CREATE TABLE c (v INT);
INSERT INTO a VALUES (1), (2), (NULL), (NULL);
INSERT INTO b VALUES (2), (2), (NULL);
INSERT INTO c VALUES (3), (2);
a
表数据:
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| NULL |
+------+
4 rows in set (0.00 sec)
b
表数据:
+------+
| v |
+------+
| 2 |
| 2 |
| NULL |
+------+
3 rows in set (0.00 sec)
c
表数据:
+------+
| v |
+------+
| 3 |
| 2 |
+------+
2 rows in set (0.00 sec)
UNION 运算
以下语句对从 a
和 b
表返回的两个结果集进行 UNION
运算:
SELECT * FROM a
UNION
SELECT * FROM b;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
+------+
3 rows in set (0.00 sec)
从输出的结果可以看出,UNION
运算删除了结果集中的重复项,返回一个唯一记录值的结果集。
UNION
是 UNION DISTINCT
的简写。
除了对两个表的记录进行 UNION
运算,也可以对 a
, b
和 c
这 3 个表的记录进行 UNION
运算。如下:
SELECT * FROM a
UNION
SELECT * FROM b
UNION
SELECT * FROM c;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| 3 |
+------+
4 rows in set (0.00 sec)
本例等同于如下的运算步骤:
- 首先对
a
和b
表的记录进行UNION
运算,并返回结果集。 - 将第 1 步的结果集和
c
表的记录进行UNION
运算。
UNION ALL 运算
以下语句对从 a
和 b
表返回的两个结果集进行 UNION ALL
运算:
SELECT * FROM a
UNION ALL
SELECT * FROM b;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| NULL |
| 2 |
| 2 |
| NULL |
+------+
7 rows in set (0.00 sec)
从输出的结果可以看出,UNION ALL
保留了两个结果集中的所有行。
除了对两个表的记录进行 UNION ALL
运算,也可以对 a
, b
和 c
这 3 个表的记录进行 UNION ALL
运算。如下:
SELECT * FROM a
UNION ALL
SELECT * FROM b
UNION ALL
SELECT * FROM c;
UNION 与 UNION ALL 组合运算
请看以下实例:
SELECT * FROM a
UNION
SELECT * FROM b
UNION ALL
SELECT * FROM c;
+------+
| v |
+------+
| 1 |
| 2 |
| NULL |
| 3 |
| 2 |
+------+
5 rows in set (0.00 sec)
本例的运算步骤如下:
- 首先对
a
和b
表的记录进行UNION
运算,并返回结果集。这一步运算删除了a
和b
表的重复记录。 - 将第 1 步的结果集和
c
表的记录进行UNION ALL
运算。这一步并没有删除c
表中与第 1 部结果集中的重复记录。
UNION 排序
当需要对 UNION
运算的结果进行排序时,最需要在 SQL 语句的最后添加 ORDER BY
子句。
以下语句对从 a
和 b
表返回的两个结果集进行 UNION ALL
运算,并升序排序:
SELECT * FROM a
UNION ALL
SELECT * FROM b
ORDER BY v;
+------+
| v |
+------+
| NULL |
| NULL |
| NULL |
| 1 |
| 2 |
| 2 |
| 2 |
| 3 |
+------+
8 rows in set (0.01 sec)
UNION 列数
当对两个结果集进行 UNION
运算的时候,要保证每个结果集具有相同的列数。否则就会产生错误。
请看如下的实例:
SELECT 1
UNION
SELECT 2, 3;
ERROR 1222 (21000): The used SELECT statements have a different number of columns
这是因为 SELECT 1
只有 1 列,而 SELECT 2, 3
则有 2 列数据。两个结果集列数不一样,导致了 UNION 运算产生错误。
以下展示了两个结果集的列数。
SELECT 1;
+---+
| 1 |
+---+
| 1 |
+---+
1 row in set (0.00 sec)
SELECT 2, 3;
+---+---+
| 2 | 3 |
+---+---+
| 2 | 3 |
+---+---+
1 row in set (0.00 sec)
本例也说明了, 参与 UNION
运算的结果集和字段的名称没有关系,只要列数一样就可以。
UNION 列名
参与 UNION
运算的结果集只要列数一样就可以。返回结果集的列名采用第一个结果集的列名。
我们先看参与 UNION
运算的两个结果集。
SELECT 1;
+---+
| 1 |
+---+
| 1 |
+---+
1 row in set (0.00 sec)
此结果集只有一列,且列名为 1
。
SELECT 2;
+---+
| 2 |
+---+
| 2 |
+---+
1 row in set (0.00 sec)
此结果集只有一列,且列名为 2
。
我们再看 UNION
运算的实例:
SELECT 1 UNION SELECT 2;
+---+
| 1 |
+---+
| 1 |
| 2 |
+---+
2 rows in set (0.00 sec)
本例中,返回结果集中的列名使用了 SELECT 1
中的列名。
现在我们交换参与运算的两个结果集的顺序。请看下面的实例:
SELECT 2 UNION SELECT 1;
+---+
| 2 |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)
本例中,返回结果集中的列名使用了 SELECT 2
中的列名。
那么,如果我们想自定义列名,只需要为第一个结果集的列设定一个别名即可。请看下面的实例:
SELECT 2 AS c
UNION
SELECT 1;
+---+
| c |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)
结论
在本文中,我们讨论在 MySQL 中对两个结果集进行 UNION
运算,以及 UNION
运算的规则。以下是 UNION
运算的要点:
UNION
运算用于将两个结果集合成一个,是数据行维度的组合。UNION
运算包括UNION DISTINCT
和UNION ALL
两种算法,其中UNION DISTINCT
可以简写为UNION
。UNION
会删除两个结果集中的重复记录行,而UNION ALL
则保留全部记录行。UNION
运算要求参与运算的两个结果集的列数必须一样。UNION
运算取第一个参与运算的结果集的列名作为最终的列名。- 可以使用
ORDER BY
对UNION
运算的结果进行排序。