sql 提供以下方法删除重复记录:1. distinct 关键字:选择唯一值一行。2. group by 子句:对数据分组,只返回每组一行(可结合聚合函数)。3. row_number() 函数:为每一行分配唯一行号,选择行号唯一的行。4. 集运算符(intersect/except/union):找到重复或唯一值。
如何使用 SQL 去重
问题:如何使用 SQL 删除表中的重复记录?
回答:
SQL 提供了多种方法来删除重复记录,包括:
-
DISTINCT 关键字:
- 选择 SELECT DISTINCT 语句仅返回表中每个唯一值一行。
-
GROUP BY 子句:
- 使用 GROUP BY 对数据进行分组,并仅返回每个组的一行。可以结合聚合函数(例如 COUNT() 或 SUM())使用 GROUP BY。
-
ROW_NUMBER() 函数:
- 使用 ROW_NUMBER() 函数为每一行分配一个唯一的行号。然后,可以通过 WHERE 子句选择行号唯一的行。
-
INTERSECT、EXCEPT 和 UNION:
-
这些集运算符可用于从表中找到重复或唯一值:
- INTERSECT:返回两个表中都存在的行。
- EXCEPT:返回在第一个表中但不在第二个表中的行。
- UNION:返回两个表中唯一存在的行。
-
示例:
-- DISTINCT 关键字 SELECT DISTINCT name FROM table_name; -- GROUP BY 子句 SELECT name, COUNT(*) AS count FROM table_name GROUP BY name HAVING COUNT(*) > 1; -- ROW_NUMBER() 函数 SELECT * FROM ( SELECT *, ROW_NUMBER() OVER (PARTITION BY name ORDER BY id) AS row_num FROM table_name ) AS subquery WHERE row_num = 1; -- INTERSECT SELECT name FROM table_name1 INTERSECT SELECT name FROM table_name2; -- EXCEPT SELECT name FROM table_name1 EXCEPT SELECT name FROM table_name2; -- UNION SELECT name FROM table_name1 UNION SELECT name FROM table_name2;
以上就是sql中如何去重的详细内容,更多请关注CTO智库其它相关文章!