IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> canal实现同步mysql至es -> 正文阅读

[大数据]canal实现同步mysql至es

目录

一、canal 简介

二、canal安装

1. 下载canal-deployer?

1.修改canal-deployer?配置文件

?2. canal-adapter配置及使用

?3. canal-admin

4. 运行测试阶段

?5. 坑总结


一、canal 简介

早期阿里巴巴因为杭州和美国双机房部署,存在跨机房同步的业务需求,实现方式主要是基于业务 trigger 获取增量变更。从 2010 年开始,业务逐步尝试数据库日志解析获取增量变更进行同步,由此衍生出了大量的数据库增量订阅和消费业务。

基于日志增量订阅和消费的业务包括

  • 数据库镜像
  • 数据库实时备份
  • 索引构建和实时维护(拆分异构索引、倒排索引等)
  • 业务 cache 刷新
  • 带业务逻辑的增量数据处理

当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7.x , 8.0.x

二、canal安装

canal官方地址:https://github.com/alibaba/canal/releases

这边以1.1.5版本为例子:

首先需要先确定mysql bin-log日志是否启动。

开启bin-log日志,这边以docker为例子:

 docker ps #查看启动的容器
#进入容器
docker exec -it 容器ID /bin/bash    
#

进入mysql:

?

?这边已经开启

如果没开启新进入config

 cd etc/mysql/mysql.conf.d/

编写conf文件加入以下三行:

[mysqld]
log-bin=mysql-bin   #开启binlog
binlog-format=ROW   #选择row模式
server_id = 1      # 配置 MySQL replaction 需要定义,不要和 canal 的 slaveId 重复

保存退出容器。

重启:mysql? ? ?

docker restart 容器ID

准备工作完毕。

1. 下载canal-deployer?

?首先安装 canal服务端 : canal.deployer

解压deployer文件? :?

tar -zxvf canal.deployer-1.1.5.tar.gz

1.修改canal-deployer?配置文件

首先进入配置文件:官方默认指定example

为什么会自带有example?文件夹,请参考官网:AdminGuide · alibaba/canal Wiki (github.com)

cd /home/canal/canal-deployer/conf/example/

修改instance.properties 文件配置:

?进入bin文件 启动服务即可

./startup.sh    #启动服务


./stop.sh      #终止服务

日志出现这个启动成功:

?2. canal-adapter配置及使用

和之前服务端一样先下载解压,我的文件结构是这样,个人按照自己配置

?

?下面配置客户端文件

进入conf文件后? ?

vim application.yml    #编辑配置文件
 

没有vim可自行下载或者使用vi 。

删除其他对我们使用无用配置后如上图所示:

?

配置数据库数据源 ,这边库记得指定先去数据库建立该库,否则启动时候会报错

?大概配置如下:

坑如下:

1. hosts地址配置第三方地址的时候记得加上 http://

2. 记得先启动服务端再启动客户端,否则会报连接失败 11111端口

3. mode: 改成rest模式

4. 报错出现out of money内存不够的时候那是你服务器内存不够开启了

然后进入es7修改sql

mytest_user.yml?

我这边 只建立了一个user表,sql:指定一下

a.id as _id 这边注意是_? 对应es那边索引id

_index:? ?对应es那边的 库名称

配置如上,完成后进入bin启动? ? ./startup.sh

下面我们去es建立索引

PUT /mytest_collect
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "fields": {
          "keyword": {
            "type": "keyword"
          }
        }
      },
      "roleId": {
        "type": "long"
      },
      "time": {
        "type": "date"
      }
    }
  }
}

建立成功。

?3. canal-admin

属于面向运维的可视化界面。这里不做过多介绍,感兴趣的可以自己去了解。

4. 运行测试阶段

INSERT INTO `mytest`.`user`(`id`, `name`, `role_id`) VALUES (24, '1ddd', 88888)

测试下

发现es同步过来了。

?5. 坑总结

1.?

当出现这个日志的时候,但是没有出现?

?这个得时候,检查es 索引是否建立。或者检查服务端配置中连接es配置是否 正确,url或者账号密码。

2.?启动时出现异常

class com.alibaba.druid.pool.DruidDataSource ?cannot be cast to ?class com.alibaba.druid.pool.DruidDataSource?

?解决方案:

源码下载后将

官方源码地址:?https://github.com/alibaba/canal/releases

修改client-adapter下escore的pom中druid包的scope为provided模式。

   <dependency>
      <groupId>com.alibaba</groupId>
      <artifactId>druid</artifactId>
      <scope>provided</scope> #新增 让es的xxxx-with-dependency.jar不包含druid相关包
   </dependency>

canal 源码: canal 1.1.5源码

这个路径下pom

我的 gitee里面有打包好的包,自行替换即可。

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-10 22:36:15  更:2022-03-10 22:36:46 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 8:30:00-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码