当前位置:首页 > linux基础 > 正文内容

Rsync文件同步

5年前 (2019-09-07)linux基础656

Rsync基本概述

rsync是一款开源、快速、多功能、可实现全量及增量的本地或远程数据同步备份的优秀工具。rsync软件适用于Unix/linux/Windows等多种操作系统平台。


Rsync简介

rsync英文称为remote synchronizetion,从软件的名称就可以看出来,rsync具有可使本地和远程两台主机之间的数据快速复制同步镜像、远程备份的功能,这个功能类似于ssh带的scp命令,但是又优于scp命令的功能,scp每次都是全量拷贝,而rsync可以增量拷贝。当然,rsync还可以在本地主机的不同分区或目录之间全量及曾量的复制数据,这又类似cp命令。但是同样也优于cp命令,cp每次都是全量拷贝,而rsync可以增量拷贝。


在同步数据的时候,默认情况下,rsync通过其独特的“quick check”算法,它仅同步大小或者最后修改时间发生变化的文件或目录,当然也可根据权限、属主等属性的变化同步,但是需要制定相应的参数,甚至可以实现只同步一个文件里有变化的内容部分,所以,可是实现快速的同步备份数据。


rsync监听端口:873

rsync运行模式:C/S


ps:利用rsync还可以实现删除文件和目录的功能,这又相当于rm命令,一个rsync相当于scp、cp、rm,但是还优于他们的每一个命令。


Rsync的特性

1、支持拷贝特殊文件,如连接文件、设备等。

2、可以有排除指定文件或目录同步的功能,相当于打包命令tar的排除功能。

3、可以做到保持原文件或目录的权限、时间、软硬链接、属主、组等所有属性均不改变 –p。

4、可以实现增量同步,既只同步发生变化的数据,因此数据传输效率很高(tar-N)。

5、可以使用rcp、rsh、ssh等方式来配合传输文件(rsync本身不对数据加密)。

6、可以通过socket(进程方式)传输文件和数据(服务端和客户端)*****。

7、支持匿名的活认证(无需系统用户)的进程模式传输,可以实现方便安全的进行数据备份和镜像。


生产场景架构集群备份方案

1、借助cron+rsync把所有客户服务器数据同步到备份服务器。

2、针对公司重要数据备份混乱状况和领导提出备份全网数据的解决方案。

3、通过本地打包备份,然后rsync结合inotify应用把全网数统一备份到一个固定存储服务器,然后在存储服务器上通过脚本检查并报警管理员备份结果。

4、定期将IDC机房的数据 备份公司的内部服务器,防止机房地震及火灾问题导致数据丢失。

5、实时同步,解决存储服务器等的单点问题。


备份类型介绍

增量备份

假设客户端上有file1 file2 file3文件,服务端上有file1文件,现要将客户端上的数据备份至服务端

image.png


全量备份

将客户端所有的数据内容file1 file2 file3全部备份至服务端 (效率低下, 占用空间)

image.png



Rsync的应用场景


Rync的数据同步模式


1、推: 所有主机推送本地数据至Rsync备份服务器,会导致数据同步缓慢(适合少量数据备份)

image.png


2、拉: rsync备份服务端拉取所有主机上的数据,会导致备份服务器开销大

image.png


3、大量服务器备份场景

image.png


4、异地备份实现思路

image.png


Rsync传输模式

Rsync使用三种主要的数据传输方式

1、本地方式

2、远程方式

3、守护进程


1、本地传输方式

单个主机本地之间的数据传输(此时类似于cp命令)

#本地拷贝数据命令
Local:  rsync [OPTION...] SRC... [DEST]
#本地拷贝数据示例
[root@backup ~]# rsync  -avz  /etc/passwd  /tmp/
rsync       #备份命令(cp)
[options]   #选项
SRC...      #本地源文件
[DEST]      #本地目标文件


2、远程传输方式

通过ssh通道传输数据,类似scp命令


#pull拉取数据命令
Pull: rsync [OPTION...] [USER@]HOST:SRC... [DEST]

#pull拉取数据示例
[root@backup ~]# rsync -avz root@172.16.1.41:/etc/hostname ./   #拉取远程文件
[root@backup ~]# rsync -avz root@172.16.1.41:/root/ /backup/   #拉取远程目录下的所有文件
[root@backup ~]# rsync -avz root@172.16.1.41:/root /backup/    #拉取远程目录以及目录下的所有文件
Pull        #拉取, 下载
rsync       #备份命令
[options]     #选项
[USER@]      #目标主机的系统用户
HOST        #目主机IP地址或域名
SRC...       #目标主机源文件
[DEST]       #下载至本地哪个位置
     
#push推送数据命令
Push: rsync [OPTION...] SRC... [USER@]HOST:DEST

#push推送数据示例
rsync -avz /backup/2018-10-01 root@172.16.1.41:/tmp/
Push        #推送, 上传
rsync       #备份命令
[options]     #选项
SRC...       #本地源文件
[USER@]      #目标主机的系统用户
HOST        #目主机IP地址或域名
[DEST]       #目标对应位置



Rsync借助SSH协议同步数据存在的缺陷

1.使用系统用户(不安全)

2.使用普通用户(会导致权限不足情况)


3、守护进程传输方式


rsync自身非常重要的功能(不使用系统用户,更加安全)

#pull拉取数据命令
Pull: rsync [OPTION...] [USER@]HOST::SRC... [DEST]

#1.拉取rsync备份服务的"backup模块"数据至本地/mnt目录
[root@nfs01 ~]# rsync -avz rsync_backup@192.172.16.1.41::backup/ /mnt/ --password-file=/etc/rsync.password
rsync           #命令
[OPTION...]       #选项
[USER@]         #远程主机用户(虚拟用户)
HOST::          #远程主机地址  
SRC...          #远程主机模块(不是目录)
[DEST]          #将远程主机数据备份至本地什么位置     

#push推送数据命令
Push: rsync [OPTION...] SRC... [USER@]HOST::DEST

#2.将本地/mnt目录推送至rsync备份服务器的backup模块
[root@nfs01 ~]# rsync -avz /mnt/ rsync_backup@192.172.16.1.41::backup/ --password-file=/etc/rsync.password
rsync           #命令
[OPTION...]       #选项
SRC...          #远程主机模块(不是目录)
[USER@]         #远程主机用户(虚拟用户)
HOST::          #远程主机地址
[DEST]          #将远程主机模块备份至本地什么位置


Rsync命令对应选项

-a           #归档模式传输, 等于-tropgDl

-v           #详细模式输出, 打印速率, 文件数量等

-z           #传输时进行压缩以提高效率

-r           #递归传输目录及子目录,即目录下得所有目录都同样传输。

-t           #保持文件时间信息

-o           #保持文件属主信息

-p           #保持文件权限

-g           #保持文件属组信息

-l           #保留软连接

-P           #显示同步的过程及传输时的进度等信息

-D           #保持设备文件信息

-L           #保留软连接指向的目标文件

-e           #使用的信道协议,指定替代rsh的shell程序

--exclude=PATTERN   #指定排除不需要传输的文件模式

--exclude-from=file #文件名所在的目录文件

--bwlimit=100       #限速传输

--partial           #断点续传

--delete            #让目标目录和源目录数据保持一致

--password-file=xxx #使用密码文件



Rsync服务实践

主机角色外网IP(WAN)内网IP(LAN)主机名称
Rsync服务端10.0.0.41172.16.1.41backup
Rsync客户端10.0.0.31172.16.1.31nfs

1、安装Rsync

[root@backup ~]# yum -y install rsync


2、配置Rsync

--- 配置详解

[root@backup ~]# vim /etc/rsyncd.conf
uid = rsync                      # 运行进程的用户
gid = rsync                      # 运行进程的用户组
port = 873                       # 监听端口
fake super = yes                 # 无需让rsync以root身份运行,允许接收文件的完整属性
use chroot = no                  # 禁锢推送的数据至某个目录, 不允许跳出该目录
max connections = 200            # 最大连接数
timeout = 600                    # 超时时间
ignore errors                    # 忽略错误信息
read only = false                # 对备份数据可读写
list = false                     # 不允许查看模块信息
auth users = rsync_backup        # 定义虚拟用户,作为连接认证用户
secrets file = /etc/rsync.passwd # 定义rsync服务用户连接认证密码文件路径
[backup]                # 定义模块信息
comment = commit        # 模块注释信息
path = /backup          # 定义接收备份数据目录


3、创建用户

创建一个用来运行rsync服务的用户身份

#1 创建rsync账户,不允许登录不创建家目录
[root@backup ~]# useradd -M -s /sbin/nologin rsync

#2 创建备份目录(尽可能磁盘空间足够大),授权rsync用户为属主
[root@backup ~]# mkdir /backup
[root@backup ~]# chown -R rsync.rsync /backup/


4、虚拟用户配置

创建虚拟用户密码文件, 授权600安全权限(用于客户端连接时使用的用户)

[root@backup ~]# echo "rsync_backup:zls" >/etc/rsync.passwd
[root@backup ~]# chmod 600 /etc/rsync.passwd


5、进程管理

启动rsync服务,并将rsync加入开机自启动

[root@backup ~]# systemctl start rsyncd
[root@backup ~]# systemctl enable rsyncd


6、检查端口

[root@backup ~]# netstat -lntup

Active Internet connections (only servers)

Proto Recv-Q Send-Q Local Address           Foreign Address         State       PID/Program name    

tcp        0      0 0.0.0.0:873             0.0.0.0:*               LISTEN      4758/rsync 


7、客户端配置

Rsync客户端仅需配置虚拟用户的密码,并授权为600安全权限

# 方式一:适合终端执行指定用户密码文件
[root@nfs01 ~]# yum install rsync -y
[root@nfs01 ~]# echo "qmf" > /etc/rsync.pass
[root@nfs01 ~]# chmod 600 /etc/rsync.pass

# 方式二:脚本中使用,强烈推荐方式
[root@nfs01 ~]# export RSYNC_PASSWORD=qmf


实例一

客户端推送backup目录下所有内容至Rsync服务端

[root@nfs01 ~]# export RSYNC_PASSWORD=qmf
[root@nfs01 ~]# rsync -avz /backup/ rsync_backup@172.16.1.41::backup/


实例二

客户端拉取Rsync服务端 backup模块数据至本地客户端的 /backup目录

[root@nfs01 ~]# export RSYNC_PASSWORD=qmf
[root@nfs01 ~]#rsync -avz rsync_backup@172.16.1.41::backup /backup/


实例三

Rsync实现数据无差异同步

#拉取远端数据:远端与本地保持一致,远端没有本地有会被删除, 造成客户端数据丢失
[root@nfs01 ~]# export RSYNC_PASSWORD=qmf
[root@nfs01 ~]# rsync -avz --delete rsync_backup@172.16.1.41::backup/ /data/

#推送数据至远端:本地与远端保持一致, 本地没有远端会被删除, 造成服务器端数据丢失
[root@nfs01 ~]# export RSYNC_PASSWORD=qmf
[root@nfs01 ~]# rsync -avz --delete /data/ rsync_backup@172.16.1.41::backup/


实例四

Rsync的Limit限速

#企业案例: 某DBA使用rsync拉取备份数据时,由于文件过大导致内部交换机带宽被沾满,导致用户的请求无法响应
[root@nfs01 ~]# export RSYNC_PASSWORD=qmf
[root@nfs01 ~]# rsync -avz --bwlimit=1 rsync_backup@172.16.1.41::backup/ /data/


Rsync备份案例

使用3台服务器主机名分别为web01、backup 、nfs主机信息见下表:


角色外网IP(WAN)内网IP(LAN)主机名
WEBeth0:10.0.0.7eth1:172.16.1.7web01
NFSeth0:10.0.0.31eth1:172.16.1.31nfs01
Rsynceth0:10.0.0.41eth1:172.16.1.41backup

客户端需求

1.客户端提前准备存放的备份的目录,目录规则如下:/backup/nfs_172.16.1.31_2018-09-02

2.客户端在本地打包备份(系统配置文件、应用配置等)拷贝至/backup/nfs_172.16.1.31_2018-09-02

3.客户端最后将备份的数据进行推送至备份服务器

4.客户端每天凌晨1点定时执行该脚本

5.客户端服务器本地保留最近7天的数据, 避免浪费磁盘空间


服务端需求

1.服务端部署rsync,用于接收客户端推送过来的备份数据

2.服务端需要每天校验客户端推送过来的数据是否完整

3.服务端需要每天校验的结果通知给管理员

4.服务端仅保留6个月的备份数据,其余的全部删除


 注意:所有服务器的备份目录必须都为/backup


建议备份的数据内容如下:

#1.开机自启动配置文件  设备挂载配置文件  本地内网配置文件    (系统配置文件)
/etc/rc.local       /etc/fstab      /etc/hosts              

#2.cron定时任务        firewalld防火墙       脚本目录      (重要目录)
/var/spool/cron/    /etc/firewalld     /server/scripts

#3.系统日志文件
/var/log/   //系统安全日志、sudo日志、内核日志、rsyslog日志

#4.应用程序服务配置文件 nginx、PHP、mysql、redis.....

1.客户端备份实现思路,脚本每天凌晨01点定时执行一次(打包->标记->推送->保留最近7天的文件)
[root@nfs scripts]# cat /server/scripts/client_rsync_backup.sh 
#!/usr/bin/bash
#1.定义变量
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin
Host=$(hostname)
Addr=$(ifconfig eth1|awk 'NR==2{print $2}')
Date=$(date +%F)
Dest=${Host}_${Addr}_${Date}
Path=/backup

#2.创建备份目录
[ -d $Path/$Dest ] || mkdir -p $Path/$Dest

#3.备份对应的文件
cd / && \
[ -f $Path/$Dest/system.tar.gz ] || tar czf $Path/$Dest/system.tar.gz etc/fstab etc/rsyncd.conf && \
[ -f $Path/$Dest/log.tar.gz ] || tar czf $Path/$Dest/log.tar.gz  var/log/messages var/log/secure && \

#4.携带md5验证信息
[ -f $Path/$Dest/flag ] || md5sum $Path/$Dest/*.tar.gz >$Path/$Dest/flag_$Date

#5.推送本地数据至备份服务器
export RSYNC_PASSWORD=zls
rsync -avz $Path/ rsync_backup@172.16.1.41::backup

#6.本地保留最近7天的数据
find $Path/ -type d -mtime +7|xargs rm -rf



2.客户端编写定时任务,让备份每天凌晨1点执行

[root@nfs01 ~]# crontab -l
00 01 * * * /bin/bash /server/scripts/backup_rsync.sh &>/dev/null


3.服务端校验客户端推送数据的完整性, (校验->存储校验结果->将保存的结果通过邮件发送给管理员->保留最近180天的数据)


#1.服务端配置邮件功能
[root@backup /]# yum install mailx -y
[root@backup /]# vim /etc/mail.rc
set from=253097001@qq.com
set smtp=smtps://smtp.qq.com:465
set smtp-auth-user=253097001@qq.com
set smtp-auth-password=#客户端授权码
set smtp-auth=login
set ssl-verify=ignore
set nss-config-dir=/etc/pki/nssdb/

#2.服务端校验、以及邮件通知脚本
[root@backup ~]# mkdir /server/scripts -p
[root@backup ~]# vim /server/scripts/check_backup.sh
#!/usr/bin/bash
#1.定义全局的变量
export PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/root/bin

#2.定义局部变量
Path=/backup
Date=$(date +%F)

#3.查看flag文件,并对该文件进行校验, 然后将校验的结果保存至result_时间
find $Path/ -type f -name "flag_$Date"|xargs md5sum -c >$Path/result_${Date}

#4.将校验的结果发送邮件给管理员
mail -s "Rsync Backup $Date" 123@qq.com <$Path/result_${Date}

#5.删除超过7天的校验结果文件, 删除超过180天的备份数据文件
find $Path/ -type f -name "result*" -mtime +7|xargs rm -f
find $Path/ -type d -mtime +180|xargs rm -rf



4.服务端编写定时任务脚本

[root@backup backup]# crontab -l
00 05 * * * /bin/bash /server/scripts/check_backup.sh &>/dev/null


5.如何扩展多台服务器的备份


[root@nfs ~]# rsync -avz /server 172.16.1.7:/

image.png


Rsync结合inotify


1.安装inotify

yum -y install inotify-tools


2.inotify参数说明


-m 持续监控

-r 递归

-q 静默,仅打印时间信息

--timefmt 指定输出时间格式

--format 指定事件输出格式

%Xe 事件

%w 目录

%f 文件

-e 指定监控的事件

access 访问

modify 内容修改

attrib 属性修改

close_write 修改真实文件内容

open 打开

create 创建

delete 删除

umount 卸载


3.命令测试

/usr/bin/inotifywait  -mrq  --format '%Xe  %w  %f' -e create,modify,delete,attrib,close_write  /backup


4.脚本编写

[root@backup ~]# vim rsyn-inotify.sh

#!/bin/bash

dir=/backup

/usr/bin/inotifywait  -mrq  --format '%w %f' -e create,delete,attrib,close_write  $dir | while read line;do

        cd  $dir  && rsync -az -R  --delete  .  rsync_backup@172.16.1.31::backup --password-file=/etc/rsync.passwd >/dev/null 2>&1

done  &


“Rsync文件同步” 的相关文章

Linux基本权限

Linux基本权限

1.什么是权限我们可以把它理解为操作系统对用户能够执行的功能所设立的限制,主要用于约束用户能对系统所做的操作,以及内容访问的范围,或者说,权限是指某个特定的用户具有特定的系统资源使用权力。2.为什么要有权限因为系统中不可能只存在一个root用户,一定会存在多个用户,为了保护每个登陆用户的隐私和工作环...

sersync实时同步

sersync实时同步

实时同步概述实时同步是一种只要当前目录发生变化则会触发一个事件,事件触发后会将变化的目录同步至远程服务器。保证数据的连续性, 减少人力维护成本,解决nfs单点故障实时同步工具选择sersync+rsync(√)、inotify+rsyncInotify是一个通知接口,用来监控文件系统的各种变化,如果...

NFS文件共享存储

NFS文件共享存储

NFS基本概述NFS是Network File System的缩写及网络文件系统。NFS主要功能是通过局域网络让不同的主机系统之间可以共享文件或目录。NFS系统和Windows网络共享、网络驱动器类似, 只不过windows用于局域网, NFS用于企业集群架构中, 如果是大型网站, 会用到更复杂的分...

Shell介绍(三)if判断,case控制,for循环,while循环,流程控制语句

if判断单分支if [你有房] then     我就嫁给你 fi多分支if [ 你有房 ] then     我就嫁给你 else   &nbs...

自动化运维(一)Ansible安装及模块的使用

自动化运维(一)Ansible安装及模块的使用

1:Ansible安装1.什么是AnsibleAnsible是python 中的一套模块,系统中的一套自动化工具,只需要使用ssh协议连接及可用来系统管理、自动化执行命令等任务。2.Ansible优势1、ansible不需要单独安装客户端,也不需要启动任何服务2、ansible是python中的一套...

自动化运维(二)Ansible Playbook

自动化运维(二)Ansible Playbook

1.Playbook剧本1.playbook翻译过来就是“剧本”,那playbook组成如下play: 定义的是主机的角色task: 定义的是具体执行的任务playbook: 由一个或多个play组成,一个play可以包含多个task任务简单理解为: 使用不同的模块完成一件事情2.playbook的...