merge 语句实现数据的差异传输

来源：互联网发布：费洛伊德算法编辑：程序博客网时间：2024/05/01 12:55

最近数据库升级到2008，研究了一下，发现有一个很好用的新功能，merge 语句加上存储过程，可以实现数据的差异传输，源表的增删改，都可以使用 merge 语句，把数据更改应用到目标表上，我们原来一个2亿多条记录的表，完全传输一次需要3个多小时，使用这个方法进行数据传输，首次花的时间和原来差不多，但是在以后的定时作业里面，看到传输时间只有不到 10分钟了，经大量数据抽样检查，数据是完全相同的，通过优化，以及增加作业的频率，可以实现数据更短的时间差，这对于表比较大，而且需要进行不定期同步的情况来说，节省了不少时间，当然，数据库镜像和数据发布订阅也能解决这个问题，但是对应用比较简单，数据同步实时性要求不高，数据量巨大的情况，这个方法部署起来还是相对简单一些的，呵呵

这个方法非常实用，但是还存在一些局限性，要根据每个表的不同，需要单独建立存储过程，这点比较繁复，有没有更好的方法，能使用在所有的表上呢？？

先把单独一个表的情况，发出来让大家分享一下，欢迎各位大侠提出更好的解决办法，能够实现多表通用

1：先在目标服务器上建立一个到源服务器的链接服务器，名字 xx2008（比较简单，不详细说了）

2：在表里面，增加一个字段 updatetime，记录数据更新时间，同时表里面要有 id 自动增加字段

3：以原库名 c_001 ， t_001 表为例，以在目标服务器上建立存储过程(以下是例程，要提高效率的话，还可以优化过程)

4：建立作业，定时调用存储过程

Create PROCEDURE [dbo].[backup_001]

AS
BEGIN

    SET NOCOUNT ON;    SET IDENTITY_Insert t_001 ON
    merge t_001 d
    using
    (SELECT * FROM OPENQUERY (xx2008 ,'select * from c_001.dbo.t_001' ) ) s
    on (d.id=s.id and d.updatetime<>s.updatetime)
    WHEN NOT MATCHED BY SOURCE THEN    delete
    when matched then
        update set
        d.f1=s.f1,
        d.f2=s.f2,
        d.f3=s.f3,
        ......
        d.updatetime=s.updatetime
    when not matched then
        insert (d.f1,d.f2,d.f3,......d.updatetime)
        values (s.f1,s.f2,s.f3,......s.updatetime);
    SET IDENTITY_Insert t_001 OFF




END