canal来实现mysql的数据同步


本文摘自PHP中文网,作者coldplay.xixi,侵删。

Mysql视频教程栏目介绍基于canal实现数据同步。

canal是什么?

canal [k?'n?l],译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费

基于日志增量订阅和消费的业务包括

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

工作原理

image.png

基于上面的讲解,我们在实现canal之前,先简单做一个主从复制。一主 一从

  • 首先下载mysql 镜像,并启动

1

2

3

docker pull mysql:latest

docker run -itd --name mysql-1 -p 23306:3306 -e MYSQL_ROOT_PASSWORD=root  mysql

docker run -itd --name mysql-2 -p 23307:3306 -e MYSQL_ROOT_PASSWORD=root  mysql复制代码

  • 相关命令再解释一下:

name xxx :xxx为容器名 p 111:222 其中111是宿主机端口,222是容器端口 MYSQL_ROOT_PASSWORD=root 设置root账户密码为root生成的容器

  • 进入容器测试一下,一切正常

image.png

  • 设置 mysql-1为主,mysql-2为从库
  • 修改一下 mysql的配置,安装vim编辑器

1

2

apt-get update

apt-get install vim复制代码

  • 在主库 创建一个mysql账户给从库使用

1

2

3

CREATE USER 'slave'@'%' IDENTIFIED BY '123456';

GRANT REPLICATION SLAVE, REPLICATION CLIENT ON . TO 'slave'@'%';

FLUSH PRIVILEGES;复制代码

在从库连接成功

  • 修改一下从服务器

1

2

3

4

5

6

7

8

[mysqld]

pid-file        = /var/run/mysqld/mysqld.pid

socket          = /var/run/mysqld/mysqld.sock

datadir         = /var/lib/mysql

secure-file-priv= NULL

server_id=100

log-bin=mysql-slave-bin

relay_log=edu-mysql-relay-bin复制代码

  • 退出重启从服务器docker
  • 进入从服务器 执行

1

mysql> change master to master_host='172.17.0.4', master_user='slave', master_password='123456', master_port=3306, master_log_file='edu-mysql-bin.000001', master_log_pos= 877, master_connect_retry=30;复制代码

相关命令解释 master_port:Master的端口号,指的是容器的端口号 master_user:用于数据同步的用户 master_password:用于同步的用户的密码 master_log_file:指定 Slave 从哪个日志文件开始复制数据,即上文中提到的 File 字段的值 master_log_pos:从哪个 Position 开始读,即上文中提到的 Position 字段的值 master_connect_retry:如果连接失败,重试的时间间隔,单位是秒,默认是60秒 在Slave 中的mysql终端执行show slave status \\\\G;用于查看主从同步状态。

  • 出现一下信息说明配置成功

image.png

  • 接下来再主库写数据,从库同步成功

image.png

  • 简单的主从同步完成了,但是我们要想,怎么实现的主从同步,对吧;

其实就是 通过 同步二进制日志文件,从服务器 会起一个io进程,读取二进制文件同步到 从服务器image.png

  • 简单看一下二进制文件的内容;

image.png

image.png

为什么再 将canal 之前要先说主从复制呢,其实canal 就是把自己伪装成了从服务器,从而读取日志,拿到数据;

使用docker 部署canal

参考链接

1

2

3

4

5

6

7

8

9

10

11

12

13

docker pull canal/canal-server:latest

# 下载脚本

wget https://raw.githubusercontent.com/alibaba/canal/master/docker/run.sh

 

# 构建一个destination name为test的队列, address 对应的数据库ip+端口 ,dbUsername对应数据库用户名,dbPassword对应数据库密码,注意修改为自己的

sh run.sh -e canal.auto.scan=false \\\\

-e canal.destinations=test \\\\

-e canal.instance.master.address=172.17.0.4:3306  \\\\

-e canal.instance.dbUsername=canal  \\\\

-e canal.instance.dbPassword=canal  \\\\

-e canal.instance.connectionCharset=UTF-8 \\\\

-e canal.instance.tsdb.enable=true \\\\

-e canal.instance.gtidon=false  \\\\复制代码

  • 启动之后可以进入容器,看一下里面的 日志,如果出现了标红的信息,说明成功,否则就查看里面的报错信息吧!也不难

image.png

image.png

  • 配合php 查看数据变化(此处不限php,java,go,python等都有接口)
  • 多语言连接https://github.com/alibaba/canal

php 监听数据变化

  • canal-php

canal-php 是阿里巴巴开源项目 Canal是阿里巴巴mysql数据库binlog的增量订阅&消费组件 的 php 客户端。为 php 开发者提供一个更友好的使用 Canal 的方式。Canal 是mysql数据库binlog的增量订阅&消费组件。

基于日志增量订阅&消费支持的业务:

  1. 数据库镜像
  2. 数据库实时备份
  3. 多级索引 (卖家和买家各自分库索引)
  4. search build
  5. 业务cache刷新
  6. 价格变化等重要业务消息

关于 Canal 的更多信息请访问 github.com/alibaba/can…

  • 应用场景

canal-php 作为Canal的客户端,其应用场景就是Canal的应用场景。关于应用场景在Canal介绍一节已有概述。举一些实际的使用例子:

1.代替使用轮询数据库方式来监控数据库变更,有效改善轮询耗费数据库资源。

2.根据数据库的变更实时更新搜索引擎,比如电商场景下商品信息发生变更,实时同步到商品搜索引擎 Elasticsearch、solr等

3.根据数据库的变更实时更新缓存,比如电商场景下商品价格、库存发生变更实时同步到redis

4.数据库异地备份、数据同步

5.根据数据库变更触发某种业务,比如电商场景下,创建订单超过xx时间未支付被自动取消,我们获取到这条订单数据的状态变更即可向用户推送消息。

阅读剩余部分

相关阅读 >>

canal来实现mysql的数据同步

更多相关阅读请进入《canal》频道 >>


数据库系统概念 第6版
书籍

数据库系统概念 第6版

机械工业出版社

本书主要讲述了数据模型、基于对象的数据库和XML、数据存储和查询、事务管理、体系结构等方面的内容。



打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...