SQL去重

上周工作中数据库中出现了N多重复记录的情况,导致联合查询时数据异常。由于数据是客户提供的,当时并没有提供唯一标识列,而且也没预料到会出现重复数据。哎,大意了。后来对表中的数据进行了一次重复查询。

1、查找表中重复记录,重复记录是根据单个字段来判断,并统计重复次数

SELECT [字段],COUNT(0) AS 重复次数 FROM [表名] GROUP BY [字段] HAVING COUNT([字段]) > 1

2、删除表中多余的重复记录,重复记录是根据单个字段来判断,只留有rowid最小的记录

DELETE FROM [表名] WHERE [字段] IN ( SELECT [字段] FROM [表名] GROUP BY [字段] HAVING COUNT([字段]) > 1 )
AND rowid NOT IN ( SELECT MIN(rowid) FROM [表名] GROUP BY [字段] HAVING COUNT([字段]) > 1 )

3、查询无重复记录,根据单个字段查询

SELECT DISTINCT [字段] FROM [表名] ORDER BY [字段]

DESCPS:血淋淋的教训,不管别人提供的数据里面否真的都是唯一的,一定要唯一主键或标识列(就算有重复的数据也不怕)。操作的时候都已唯一主键或标识列来联合,要合理的使用本表主键和对方提供的唯一主键进行操作。
来源:http://jackyxfl.blog.163.com/blog/static/164134150201111839963/

此条目发表在mysql/oracle/postgresql分类目录,贴了标签。将固定链接加入收藏夹。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据