rsync+inotify实现实时单向同步

来源:互联网 发布:怎么淘宝贷款高额 编辑:程序博客网 时间:2024/06/09 19:55

rsync+inotify实现实时单向同步

相关原理

1. Rsync

man一下sync,就会发现:sync-flush file system buffers,它是一个把缓冲区中的数据同步到文件系统中的一个命令;而rsync其实就是remote rsync,它是一个远程同步工具,兼具cp和scp的功能,rsync命令的使用几乎和scp是一样一样的。Rsync是通过超级守护进程xinetd进行触发同步的,一般来说是os自带,不需要安装

使用 rsync 进行远程同步时,可以使用两种方式:远程 Shell 方式(建议使用 ssh,用户验证由 ssh 负责)和 C/S 方式(即客户连接远程 rsync 服务器,用户验证由 rsync 服务器负责)。

  无论本地同步目录还是远程同步数据,首次运行时将会把全部文件拷贝一次,以后再运行时将只拷贝有变化的文件(对于新文件)或文件的变化部分(对于原有文件)。rsync 在首次复制时没有速度优势,速度不如 tar,因此当数据量很大时您可以考虑先使用 tar 进行首次复制,然后再使用 rsync 进行数据同步

rsycn就是用于同步的工具,只要服务器端配置(安装rsync源码好,具体的配置参数依据自己的应用而定。而客户端的同步命令也是依据个人的环境而定。

2. inotify

Inotify 是一种强大的、细粒度的、异步的文件系统事件监控机制linux内核从2.6.13起,加入了Inotify支持,通过Inotify可以监控文件系统中添加、删除,修改、移动等各种细微事件,利用这个内核接口,第三方软件就可以监控文件系统下文件的各种变化情况,而inotify-tools就是这样的一个第三方软件

3. rsync+inotify rsync+crontab

1)服务器性能:rsync+crontab会定时(轮询)去检查是否有文件更新,这势必会造成服务器性能下降;而rsync+inotify组合是触发式更新(通知),只有在数据文件有变化时,才会去更新,因此相对前者而言,是提高了服务器性能。

2)数据实时性:rsync+crontab是周期性任务计划,不能保证数据的实时性rsync+inotify组合是触发式更新,只要有数据变化,就立刻同步更新

 

需求分析

源服务器          229
目标服务器        201
目的:229-201数据的单向同步,实现源服务器/home/libi文件夹文件实时同步到目标服务器/home/libi目录下:如果229目录下的文件有变化,则201对应的目录自动同步。

Ø 229作为源端,需要rsync进程以守护进程(服务器端)的方式运行,方便inotify_tools(客户端)监控目录随时发生变化,而随时调用rsync功能。

Ø 201作为目的端,需要安装软件rsync,但是不需要以守护进程方式执行,因为linux系统一般默认安装,因此这里不需要安装

源端环境配置

Rsync守护进程配置(服务端)

v Rsync --version  //查看rsync源码是否安装,如果已经安装,则不需要安装

v Rsync --daemon  //可以显示rsync的配置文件,一般在/etc/rsyncd.conf

v (rsync --daemon --config=/etc/rsyncd.conf 以守护进程启动源的rsync服务)

v Vim /etc/rsyncd.conf

 

uid=root

gid=root

use chroot=no

strict modes=873

[backup]

path=/home/libi/rsync_inotify/backup_test

comment=test

ignore errors

read only=no

list=yes

auth users=root

#secrets file = /etc/rsync.pas

host allow=*

 

 

 

 

 

229-201免密码登录

v ssh-keygen -t rsa  //直接回车,默认在/root目录下生成/root/.ssh/id_rsa.pub

v Scp /root/.ssh/id_rsa.pub root@10.0.6.201 /root/.ssh/authorized_keys   //拷贝.ssh/id_rsa.pub到服务器端的.ssh/authorized_keys文件中

v chmod 600 /root/.ssh/authorized_keys   //在目标段201执行设置权限

 

v ps -ef |grep rsync    //查看rsync进程端口为873

Inotify_tools配置(客户端)

v tar -zxvf inotify-tools-3.13.tar.gz

v cd inotify-tools-3.13

v ./configure --prefix=/usr/local/inotify && make && su -c 'make install'

v cd /usr/local/inotify/bin

v Vim  monitor.sh

 

#!/bin/bash

SRC=/home/libi/

DST=root@10.0.6.201:/home/libi

su - root -c "/usr/bin/rsync -ahqzt --delete $SRC $DST"

/usr/local/bin/inotifywait -mrq -e modify,delete,create,attrib ${SRC} | while read status

do

su - root -c "/usr/bin/rsync -ahqzt --delete $SRC $DST"

echo "`date +'%Y-%m-%d %H:%M:%S'` ${status} has rsynced " >>rsync.log

done

 

v chmod +x monitor.sh

v ./monitor.sh   //启动monitor.sh

v cat "/usr/local/inotify/bin/monitor.sh" >> /etc/rc.local //放到rc.local实现开机启动,执行monitor,实时监控

注释:

/usr/local/bin/inotifywait -mrq -e modify,delete,create,attrib ${src}

-m 是保持一直监听
-r 是递归查看目录
-q 是打印出事件
-e create,move,delete,modify,attrib 是指 “监听 创建 移动 删除 写入 权限” 事件

/usr/bin/rsync -ahqzt --delete $SRC $DST
-a 存档模式
-h 保存硬连接
-q 制止非错误信息
-z 压缩文件数据在传输
-t 维护修改时间
-delete 删除于多余文件

rsync的完整参数说明:

-v, --verbose 详细模式输出
-q, --quiet 精简输出模式
-c, --checksum 打开校验开关,强制对文件传输进行校验
-a, --archive 归档模式,表示以递归方式传输文件,并保持所有文件属性,等于-rlptgoD
-r, --recursive 对子目录以递归模式处理
-R, --relative 使用相对路径信息
-b, --backup 创建备份,也就是对于目的已经存在有同样的文件名时,将老的文件重新命名为~filename。可以使用--suffix选项来指定不同的备份文件前缀。
--backup-dir 将备份文件(如~filename)存放在在目录下。
-suffix=SUFFIX 定义备份文件前缀
-u, --update 仅仅进行更新,也就是跳过所有已经存在于DST,并且文件时间晚于要备份的文件。(不覆盖更新的文件)
-l, --links 保留软链结
-L, --copy-links 想对待常规文件一样处理软链结
--copy-unsafe-links 仅仅拷贝指向SRC路径目录树以外的链结
--safe-links 忽略指向SRC路径目录树以外的链结
-H, --hard-links 保留硬链结
-p, --perms 保持文件权限
-o, --owner 保持文件属主信息
-g, --group 保持文件属组信息
-D, --devices 保持设备文件信息
-t, --times 保持文件时间信息
-S, --sparse 对稀疏文件进行特殊处理以节省DST的空间
-n, --dry-run现实哪些文件将被传输
-W, --whole-file 拷贝文件,不进行增量检测
-x, --one-file-system 不要跨越文件系统边界
-B, --block-size=SIZE 检验算法使用的块尺寸,默认是700字节
-e, --rsh=COMMAND 指定使用rsh、ssh方式进行数据同步
--rsync-path=PATH 指定远程服务器上的rsync命令所在路径信息
-C, --cvs-exclude 使用和CVS一样的方法自动忽略文件,用来排除那些不希望传输的文件
--existing 仅仅更新那些已经存在于DST的文件,而不备份那些新创建的文件
--delete 删除那些DST中SRC没有的文件
--delete-excluded 同样删除接收端那些被该选项指定排除的文件
--delete-after 传输结束以后再删除
--ignore-errors 及时出现IO错误也进行删除
--max-delete=NUM 最多删除NUM个文件
--partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
--force 强制删除目录,即使不为空
--numeric-ids 不将数字的用户和组ID匹配为用户名和组名
--timeout=TIME IP超时时间,单位为秒
-I, --ignore-times 不跳过那些有同样的时间和长度的文件
--size-only 当决定是否要备份文件时,仅仅察看文件大小而不考虑文件时间
--modify-window=NUM 决定文件是否时间相同时使用的时间戳窗口,默认为0
-T --temp-dir=DIR 在DIR中创建临时文件
--compare-dest=DIR 同样比较DIR中的文件来决定是否需要备份
-P 等同于 --partial
--progress 显示备份过程
-z, --compress 对备份的文件在传输时进行压缩处理
--exclude=PATTERN 指定排除不需要传输的文件模式
--include=PATTERN 指定不排除而需要传输的文件模式
--exclude-from=FILE 排除FILE中指定模式的文件
--include-from=FILE 不排除FILE指定模式匹配的文件
--version 打印版本信息
--address 绑定到特定的地址
--config=FILE 指定其他的配置文件,不使用默认的rsyncd.conf文件
--port=PORT 指定其他的rsync服务端口
--blocking-io 对远程shell使用阻塞IO
-stats 给出某些文件的传输状态
--progress 在传输时现实传输过程
--log-format=formAT 指定日志文件格式
--password-file=FILE 从FILE中得到密码
--bwlimit=KBPS 限制I/O带宽,KBytes per second
-h, --help 显示帮助信息

要排除同步某个目录时,为rsync添加--exculde=PATTERN参数,注意,路径是相对路径,具体查看man rsync。
要排除某个目录的事件监听的处理时,为inotifywait添加--exclude或--excludei参数,具体查看man inotifywait。

Rsync版本安装

 

v which rsync    //which命令会从$PATH环境变量中,按照先后顺序,找出最先搜索到的rsync命令所在路径,无论你的系统里有多少个rsync命令,这个which的结果才是你在命令行中使用rsync命令式时用到的那个一。例如:/usr/bin/rsync

v rpm -qf /usr/bin/rsync  //查看该命令属于哪个安装包,例如:rsync-2.6.8-3.1

v rpm -e rsync-2.6.8-3.1    //卸载rsync-2.6.8-3.1

 

 安装新版本3.1.2

v tar zxvf rsync-3.1.2.tar.gz   //进行解压

v  cd rsync-3.1.2/        //进入解压缩出来的文件夹内

v  ./configure --prefix=/usr/local/rsync  //指定安装的文件夹,注意prefix=后面不要留有空格,否则会报错

v Make &&  sudo make install     //默认rsync命令被安装在这里:/usr/local/bin/rsync

v which rsync   //看看是否能找到rsync命令,通常情况下,linux的$PATH变量,会把/usr/local/bin置于/usr/bin之前,所以即使你不卸载旧版本,也会默认的使用新版本了,当然,我还是建议卸载掉旧版本,图个干净,呵呵

v rsync --version //看看是否是新版本了,如果提示找不到该命令,那是shell缓存的原因,重新登录一遍应该就好了

 

 

 

0 0
原创粉丝点击