MySQL UNION 的用法与实例

在本文中,我们讨论在 MySQL 中对两个结果集进行 UNION 运算,以及 UNION 运算的规则。

在 MySQL 中,UNION 操作符是一个集合操作符,它用于合并 2 个结果集中的所有的行。

SQL 标准中定义了 3 个集合操作符: UNION, INTERSECTMINUS。目前 MySQL 只支持 UNION

UNION 操作符语法

UNION 操作符用来合并两个 SELECT 语句的结果集。UNION 操作符的语法如下:

SELECT statement
UNION [DISTINCT | ALL]
SELECT statement

说明:

  • UNION 双目操作符,需要两个 SELECT 语句作为操作数。
  • UNION 中的 SELECT 语句中的列数、列顺序必须相同。
  • UNION 运算包括 UNION DISTINCTUNION ALL 两种算法,其中 UNION DISTINCT 可以简写为 UNION
  • UNION DISTINCTUNION 将过滤掉结果集中重复记录。
  • UNION ALL 将返回结果集中的所有记录。

UNION 实例

建立测试表和测试数据

在以下实例中,我们创建 ab 两个表进行演示。

创建测试表并插入测试数据

CREATE TABLE a (v INT);
CREATE TABLE b (v INT);
CREATE TABLE c (v INT);

INSERT INTO a VALUES (1), (2), (NULL), (NULL);
INSERT INTO b VALUES (2), (2), (NULL);
INSERT INTO c VALUES (3), (2);

a 表数据:

+------+
| v    |
+------+
|    1 |
|    2 |
| NULL |
| NULL |
+------+
4 rows in set (0.00 sec)

b 表数据:

+------+
| v    |
+------+
|    2 |
|    2 |
| NULL |
+------+
3 rows in set (0.00 sec)

c 表数据:

+------+
| v    |
+------+
|    3 |
|    2 |
+------+
2 rows in set (0.00 sec)

UNION 运算

以下语句对从 ab 表返回的两个结果集进行 UNION 运算:

SELECT * FROM a
UNION
SELECT * FROM b;
+------+
| v    |
+------+
|    1 |
|    2 |
| NULL |
+------+
3 rows in set (0.00 sec)

从输出的结果可以看出,UNION 运算删除了结果集中的重复项,返回一个唯一记录值的结果集。

UNIONUNION DISTINCT 的简写。

除了对两个表的记录进行 UNION 运算,也可以对 a, bc 这 3 个表的记录进行 UNION 运算。如下:

SELECT * FROM a
UNION
SELECT * FROM b
UNION
SELECT * FROM c;
+------+
| v    |
+------+
|    1 |
|    2 |
| NULL |
|    3 |
+------+
4 rows in set (0.00 sec)

本例等同于如下的运算步骤:

  1. 首先对 ab 表的记录进行 UNION 运算,并返回结果集。
  2. 将第 1 步的结果集和 c 表的记录进行 UNION 运算。

UNION ALL 运算

以下语句对从 ab 表返回的两个结果集进行 UNION ALL 运算:

SELECT * FROM a
UNION ALL
SELECT * FROM b;
+------+
| v    |
+------+
|    1 |
|    2 |
| NULL |
| NULL |
|    2 |
|    2 |
| NULL |
+------+
7 rows in set (0.00 sec)

从输出的结果可以看出,UNION ALL 保留了两个结果集中的所有行。

除了对两个表的记录进行 UNION ALL 运算,也可以对 a, bc 这 3 个表的记录进行 UNION ALL 运算。如下:

SELECT * FROM a
UNION ALL
SELECT * FROM b
UNION ALL
SELECT * FROM c;

UNION 与 UNION ALL 组合运算

请看以下实例:

SELECT * FROM a
UNION
SELECT * FROM b
UNION ALL
SELECT * FROM c;
+------+
| v    |
+------+
|    1 |
|    2 |
| NULL |
|    3 |
|    2 |
+------+
5 rows in set (0.00 sec)

本例的运算步骤如下:

  1. 首先对 ab 表的记录进行 UNION 运算,并返回结果集。这一步运算删除了 ab 表的重复记录。
  2. 将第 1 步的结果集和 c 表的记录进行 UNION ALL 运算。这一步并没有删除 c 表中与第 1 部结果集中的重复记录。

UNION 排序

当需要对 UNION 运算的结果进行排序时,最需要在 SQL 语句的最后添加 ORDER BY 子句。

以下语句对从 ab 表返回的两个结果集进行 UNION ALL 运算,并升序排序:

SELECT * FROM a
UNION ALL
SELECT * FROM b
ORDER BY v;
+------+
| v    |
+------+
| NULL |
| NULL |
| NULL |
|    1 |
|    2 |
|    2 |
|    2 |
|    3 |
+------+
8 rows in set (0.01 sec)

UNION 列数

当对两个结果集进行 UNION 运算的时候,要保证每个结果集具有相同的列数。否则就会产生错误。

请看如下的实例:

SELECT 1
UNION
SELECT 2, 3;
ERROR 1222 (21000): The used SELECT statements have a different number of columns

这是因为 SELECT 1 只有 1 列,而 SELECT 2, 3 则有 2 列数据。两个结果集列数不一样,导致了 UNION 运算产生错误。

以下展示了两个结果集的列数。

SELECT 1;
+---+
| 1 |
+---+
| 1 |
+---+
1 row in set (0.00 sec)
SELECT 2, 3;
+---+---+
| 2 | 3 |
+---+---+
| 2 | 3 |
+---+---+
1 row in set (0.00 sec)

本例也说明了, 参与 UNION 运算的结果集和字段的名称没有关系,只要列数一样就可以。

UNION 列名

参与 UNION 运算的结果集只要列数一样就可以。返回结果集的列名采用第一个结果集的列名。

我们先看参与 UNION 运算的两个结果集。

SELECT 1;
+---+
| 1 |
+---+
| 1 |
+---+
1 row in set (0.00 sec)

此结果集只有一列,且列名为 1

SELECT 2;
+---+
| 2 |
+---+
| 2 |
+---+
1 row in set (0.00 sec)

此结果集只有一列,且列名为 2

我们再看 UNION 运算的实例:

SELECT 1 UNION SELECT 2;
+---+
| 1 |
+---+
| 1 |
| 2 |
+---+
2 rows in set (0.00 sec)

本例中,返回结果集中的列名使用了 SELECT 1 中的列名。

现在我们交换参与运算的两个结果集的顺序。请看下面的实例:

SELECT 2 UNION SELECT 1;
+---+
| 2 |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)

本例中,返回结果集中的列名使用了 SELECT 2 中的列名。

那么,如果我们想自定义列名,只需要为第一个结果集的列设定一个别名即可。请看下面的实例:

SELECT 2 AS c
UNION
SELECT 1;
+---+
| c |
+---+
| 2 |
| 1 |
+---+
2 rows in set (0.00 sec)

结论

在本文中,我们讨论在 MySQL 中对两个结果集进行 UNION 运算,以及 UNION 运算的规则。以下是 UNION 运算的要点:

  • UNION 运算用于将两个结果集合成一个,是数据行维度的组合。
  • UNION 运算包括 UNION DISTINCTUNION ALL 两种算法,其中 UNION DISTINCT 可以简写为 UNION
  • UNION 会删除两个结果集中的重复记录行,而 UNION ALL 则保留全部记录行。
  • UNION 运算要求参与运算的两个结果集的列数必须一样。
  • UNION 运算取第一个参与运算的结果集的列名作为最终的列名。
  • 可以使用 ORDER BYUNION 运算的结果进行排序。