sql刪除重復數據的詳細方法

當前位置：首頁 > 范文|應用文 > IT技術專欄 > 數據庫

sql刪除重復數據的詳細方法

來源：易賢網閱讀：896 次日期：2014-11-03 11:50:20

溫馨提示：易賢網小編為您整理了“sql刪除重復數據的詳細方法”,方便廣大網友查閱！

重復數據，通常有兩種：一是完全重復的記錄，也就是所有字段的值都一樣;二是部分字段值重復的記錄。

一. 刪除完全重復的記錄

完全重復的數據，通常是由于沒有設置主鍵/唯一鍵約束導致的。

測試數據：

if OBJECT_ID('duplicate_all') is not null

drop table duplicate_all

create table duplicate_all

(

c1 int,

c2 int,

c3 varchar(100)

)

insert into duplicate_all

select 1,100,'aaa' union all

select 2,200,'bbb' union all

select 3,300,'ccc' union all

select 4,400,'ddd' union all

select 5,500,'eee'

(1) 借助臨時表

利用DISTINCT得到單條記錄，刪除源數據，然后導回不重復記錄。

如果表不大的話，可以把所有記錄導出一次，然后truncate表后再導回，這樣可以避免delete的日志操作。

if OBJECT_ID('tempdb..#tmp') is not null

drop table #tmp

select distinct * into #tmp

from duplicate_all

where c1 = 1

delete duplicate_all where c1 = 1

insert into duplicate_all

select * from #tmp

(2) 使用ROW_NUMBER

with tmp

(

select *,ROW_NUMBER() OVER(PARTITION BY c1,c2,c3 ORDER BY(getdate())) as num

from duplicate_all

where c1 = 1

)

delete tmp where num > 1

如果多個表有完全重復的行，可以考慮通過UNION將多個表聯合，插到一個新的同結構的表，SQL Server會幫助去掉表和表之間的重復行。

二. 刪除部分重復的記錄

部分列重復的數據，通常表上是有主鍵的，可能是程序邏輯造成了多行數據列值的重復。

測試數據：

if OBJECT_ID('duplicate_col') is not null

drop table duplicate_col

create table duplicate_col

(

c1 int primary key,

c2 int,

c3 varchar(100)

)

insert into duplicate_col

select 1,100,'aaa' union all

select 2,100,'aaa' union all

select 3,100,'aaa' union all

select 4,100,'aaa' union all

select 5,500,'eee'

(1) 唯一索引

唯一索引有個忽略重復建的選項，在創建主鍵約束/唯一鍵約束時都可以使用這個索引選項。

if OBJECT_ID('tmp') is not null

drop table tmp

create table tmp

(

c1 int,

c2 int,

c3 varchar(100),

constraint UQ_01 unique(c2,c3) with(IGNORE_DUP_KEY = ON)

)

insert into tmp

select * from duplicate_col

select * from tmp

(2) 借助主鍵/唯一鍵來刪除

通常會選擇主鍵/唯一鍵的最大/最小值保留，其他行刪除。以下只保留重復記錄中c1最小的行。

delete from duplicate_col

where exists(select 1 from duplicate_col b where duplicate_col.c1 > b.c1 and (duplicate_col.c2 = b.c2 and duplicate_col.c3 = b.c3))

--或者

delete from duplicate_col

where c1 not in (select min(c1) from duplicate_col group by c2,c3)

如果要保留重復記錄中的第N行，可以參考05.取分組中的某幾行。

(3) ROW_NUMBER

和刪除完全重復記錄的寫法基本一樣。

with tmp

(

select *,ROW_NUMBER() OVER(PARTITION BY c2,c3 ORDER BY(getdate())) as num

from duplicate_col

)

delete tmp where num > 1

select * from duplicate_col

更多信息請查看IT技術專欄

上一篇：SQLServer觸發器創建、刪除、修改、查看示例代碼

下一篇：有用的SQL語句(刪除重復記錄，收縮日志)

易賢網手機網站地址：sql刪除重復數據的詳細方法

由于各方面情況的不斷調整與變化，易賢網提供的所有考試信息和咨詢回復僅供參考，敬請考生以權威部門公布的正式信息和咨詢為準！

相關閱讀數據庫

解決MongoDB 排序超過內存限制的問題08月04日

Windows下MongoDb簡單配置教程08月04日

Mongodb實戰之全文搜索功能08月04日

MongoDB 管道的介紹及操作符實例08月04日

在Linux服務器中配置mongodb環境的步驟08月04日

mac下安裝和配置mongodb的步驟詳解08月04日

Mongo復制集同步驗證的實例詳解08月04日

MongoDB 中Limit與Skip的使用方法詳解08月04日

Oracle刪除數據報ORA 02292錯誤的巧妙解決方法08月04日

Oracle查詢最近幾天每小時歸檔日志產生數量的腳本寫法08月04日

Oracle查看表結構命令詳解08月04日

Oracle 11g如何清理數據庫的歷史日志詳解08月04日

Oracle表中重復數據去重的方法實例詳解08月04日

WIN7下ORACLE10g服務端和客戶端的安裝圖文教程08月04日

Oracle查看表結構的幾種方法示例代碼08月04日

pl/sql連接遠程oracle服務器的配置教程08月04日

IOS 數據庫升級數據遷移的實例詳解08月04日

mysql exists與not exists實例詳解08月04日

關于Windows10下解決MySQL5.5數據庫命令行中文亂碼問題08月04日

細說MySQL死鎖與日志二三事08月04日

易賢網移動網站

2026國考·省考課程試聽報名

報班類型
姓名
手機號
驗證碼