DISTINCT

DISTINCT关键字与SELECT语句一起使用,用于去除重复记录,只获取唯一的记录。

当一个表中有多个重复记录,当提取这样的记录时,DISTINCT关键字就显得特别有意义,它只获取唯一一次记录,而不是获取重复记录。

语法格式

  1. SELECT DISTINCT [ ON ( expression [, ...] ) ] ]
  2. { * | [column, ...] }
  3. [ FROM from_item [, ...] ];

参数说明

  • DISTINCT [ ON ( expression [, …] ) ]

从SELECT的结果集中删除所有重复的行,使结果集中的每行都是唯一的。

ON ( expression [, …] ) 只保留那些在给出的表达式上运算出相同结果的行集合中的第一行。

示例

在表customer_t1中插入两条数据:

  1. openGauss=# INSERT INTO customer_t1 (c_customer_sk, c_customer_id, c_first_name,Amount) VALUES
  2. (6881, 'maps', 'Lily',1000),
  3. (4320, 'tpcds', 'Lily',2000);

现在数据如下:

  1. openGauss=# SELECT * FROM customer_t1 ;
  2. c_customer_sk | c_customer_id | c_first_name | c_last_name | amount
  3. ---------------+---------------+--------------+-------------+--------
  4. 3869 | hello | Grace | | 1000
  5. 3869 | hello | Grace | | 1000
  6. 3869 | | Grace | |
  7. 3869 | hello | | |
  8. 3869 | hello | | |
  9. | | | |
  10. 6985 | maps | Joes | | 2200
  11. 9976 | world | James | | 5000
  12. 4421 | Admin | Local | | 3000
  13. 6881 | maps | Lily | | 1000
  14. 4320 | tpcds | Lily | | 2000
  15. (11 rows)

查询customer_t1表中所有的c_first_name。其中存在两个Lily和三个Grace。

  1. openGauss=# SELECT c_first_name FROM customer_t1 ;
  2. c_first_name
  3. --------------
  4. Grace
  5. Grace
  6. Grace
  7. Joes
  8. James
  9. Local
  10. Lily
  11. Lily
  12. (11 rows)

在SELECT语句中使用DISTINCT关键字。从结果中可以发现,重复数据已经被删除。

  1. openGauss=# SELECT DISTINCT c_first_name FROM customer_t1 ;
  2. c_first_name
  3. --------------
  4. James
  5. Grace
  6. Local
  7. Joes
  8. Lily
  9. (6 rows)