删除重复记录

来源:互联网 发布:哈工大深圳知乎 编辑:程序博客网 时间:2024/05/01 08:04

SQL Server中 除了对拥有十几条记录的表进行人工删除外,实现删除重复记录一般都是写一段代码,用游标的方法一行一行检查,删除重复的记录。因为这种方法需要对整个表进 行遍历,所以对于表中的记录数不是很大的时候还是可行的,如果一张表的数据达到上百万条,用游标的方法来删除简直是个噩梦,因为它会执行相当长的一段时 间。

  四板斧——轻松消除重复记录

  殊不知在SQL Server中有一种更为简单的方法,它不需要用游标,只要写一句简单插入语句就能实现删除重复记录的功能。为了能清楚地表述,我们首先假设存在一个产品信息表Products,其表结构如下:

 

  1. CREATE TABLE Products (
  2.  ProductID int,
  3.  ProductName nvarchar (40),
  4.  Unit char(2),
  5.  UnitPrice money
  6.  )

 

产品ChangTofu的记录在产品信息表中存在重复。现在要删除这些重复的记录,只保留其中的一条。步骤如下:

  第一板斧——建立一张具有相同结构的临时表

 

  1. CREATE TABLE Products (
  2.  ProductID int,
  3.  ProductName nvarchar (40),
  4.  Unit char(2),
  5.  UnitPrice money
  6.  )

 

  第二板斧——为该表加上索引,并使其忽略重复的值

  方法是在企业管理器中找到上面建立的临时表Products _temp,单击鼠标右键,选择所有任务,选择管理索引,选择新建一个索引,然后选择“唯一值”,选择“忽略重复值”。
  第三板斧——拷贝产品信息到临时表

 

  1. insert into Products_temp Select * from Products

 

  此时SQL Server会返回如下提示:

  服务器: 消息 3604,级别 16,状态 1,行 1

  已忽略重复的键。

  它表明在产品信息临时表Products_temp中不会有重复的行出现。

  第四板斧——将新的数据导入原表

  将原产品信息表Products清空,并将临时表Products_temp中数据导入,最后删除临时表Products_temp

 

  1. delete Products
  2.  insert into Products select * from Products_temp
  3.  drop table Products_temp<span style="font-size: 10.5pt"></span>