[系统运维] clickhouse两分片两副本集群搭建

开发: C++知识库 Java知识库 JavaScript Python PHP知识库人工智能区块链大数据移动开发嵌入式开发工具数据结构与算法开发测试游戏开发网络协议系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑笔记本显卡显示器固态硬盘硬盘耳机手机 iphone vivo oppo 小米华为单反装机图拉丁

-> 系统运维 -> clickhouse两分片两副本集群搭建 -> 正文阅读

[系统运维]clickhouse两分片两副本集群搭建

最近工作中遇到了clickhouse副本存储的问题，所以准备搭建一套clickhouse集群研究下，这里将搭建的过程和遇到的坑记录下，便于以后使用。下面是集群的大致分布以及具体的搭建流程。

1、准备两台虚拟机，分别安装clickhouse的服务端和客户端

准备的虚拟机是centos7。这里的安装过程是纯粹拷贝的官网命令，首先?验证虚拟机是否支持clickhouse的安装：
? ? ? ? grep -q sse4_2 /proc/cpuinfo && echo "SSE 4.2 supported" || echo "SSE 4.2 not supported"
其次，安装clickhouse需要的依赖：
????????sudo yum install yum-utils
????????sudo rpm --import https://repo.clickhouse.tech/CLICKHOUSE-KEY.GPG
????????sudo yum-config-manager --add-repo https://repo.clickhouse.tech/rpm/stable/x86_64
最后，一条语句安装clickhouse的服务端和客户端：
????????sudo yum install clickhouse-server clickhouse-client
官网还有更多安装方式（参考地址：https://clickhouse.tech/docs/en/getting-started/install/），特别是如果最后一条安装客户端服务端命令失败时，可以直接下载对应的rpm包，常见的下载client、server、common三个包，因为正常yum命令安装也是安装这三个包，官网点击位置如下：

下载的样例如下：

下载完后，rpm安装命令如下：
????????rpm -ivh clickhouse-common-static-21.7.2.7-2.x86_64.rpm clickhouse-client-21.7.2.7-2.noarch.rpm clickhouse-server-21.7.2.7-2.noarch.rpm
安装时，可能会需要输入默认用户的密码，一般是为空直接回车，如果设置了也没事，可以在安装完成后进入/etc/clickhouse-server/users.d/目录下，删除里面的文件即可。

2、启动和验证

这里仅是用于启动和验证刚才安装的服务是否可用，集群的验证在集群搭起来后进行。完成后，使用官网命令启动服务：
????????clickhouse-server --config-file=/etc/clickhouse-server/config.xml
这个命令会把clickhouse-server进程的信息持续打印在当前窗口，如果报用户权限问题，如下：
????????Effective user of the process (root) does not match the owner of the data (clickhouse). Run under 'sudo -u clickhouse'
可以进入/var/lib/目录，通过如下命令修改文件的访问权限为root（我测试用的是root，所以这块要看不同人的配置）。
? ? ? ? chown -R root:root? /var/lib/clickhous
其实报错中还提示了一种解决方式就是通过sudo命令切换账号，但是我切换后，有些root可以访问的文件是clickhouse用户访问不了，所以我采用了修改clickhouse相关文件的访问用户为root的方式。所以如果启动没报错，可以另开一个窗口，输入clickhouse-client看看能否正确进入客户端。另外如果嫌弃上述启动clickhouse服务的方式需要占用一个命令窗不安全和方便，可以通过在命令后添加 --daemon 参数来设置linux服务器后来启动clickhouse-server

这里再说一个坑，就是使用sytemctl命令启动服务：
????????systemctl start clickhouse-server
单节点单实例这个命令不会有任何问题，也就是不会出现上面所说的用户访问权限问题，但是单节点多实例，这个命令就会出现用户组和用户的权限问题。所以该命令方式尽量慎用，尽量采用官网推荐方式（具体原因好像和systemctl的机制有关，后面有时间再研究）

最后验证结束即可关闭运行窗口，开始进行后续的多实例集群配置。

3、安装zookeeper集群
clickhouse对zookeeper的依赖很重，所以必须要有zookeeper集群。
因为之前三个节点已经有zk集群，所以这里我没有专门安装部署，如果没部署可以任意搜篇文章参考部署（下面我简述下自己zk的配置，用于以后个人参考，大家如果看着条理不清晰，建议上网查专门的文章参考）。
zk的安装部署很简单，主要是下载对应的包，然后解压，重命名zoo.cfg文件，在配置末尾加上集群信息（这里我用的是host映射方式，没有直接写ip）：
????????server.1=bigdata.node1:2888:3888
????????server.2=bigdata.node2:2888:3888
????????server.3=bigdata.node3:2888:3888
最后再zoo.cfg中 dataDir=*** 指定的目录下创建myid文件，里面加上zk节点的序号，注意每个节点都不一样。
另外如果想修改zk的日志存储地址，可以修改log4j.properties中的相关属性配置

4、修改配置文件

clickhouse-server的配置文件一般有两个，都位于/etc/clickhouse-server目录下，名称分别为config.xml，users.xml，后者用于配置clickhouse的账号密码等用户访问权限，前者则是配置除此外的其它所有配置。这里不准备修改用户账号信息，所以不准备修改users.xml文件，下面仅仅是修改config.xml文件。

另外，网上很多文章配置集群时都会新建一个metrika.xml文件，这是因为在config.xml中可以使用<include_from>标签引入外部XML文件的配置，如集群、ZooKeeper配置等，并在其他标签中使用incl属性直接引用之（千万要记得用incl属性引入，仅仅用<include_from>标签引入不会生效）。但这并非强制的规范，我这里为了减少配置的文件数，所以都是直接在config.xml中配置。

为了防止浏览配置文件不清晰主机名，这里提一下，我个人大数据集群有node1、node2、node3三个节点，后两个节点用来安装的clickhouse双分片双副本集群。

这里首先在每个节点通过
????????cp /etc/clickhouse-server/config.xml /etc/clickhouse-server/config2.xml
命令生成第二个实例的配置文件，配置的内容主要由三块，分别是：

4.1、日志、数据存储路径以及各种端口号
这些内容在单节点单实例集群中其实不用修改，单节点多实例为了避免冲突，所以需要配置一下：

节点1（节点2的config.xml与这个相同） config.xml
    <logger>
        <level>trace</level>
        <log>/var/log/clickhouse-server/clickhouse-server.log</log>
        <errorlog>/var/log/clickhouse-server/clickhouse-server.err.log</errorlog>
        <size>1000M</size>
        <count>10</count>
    </logger>

    <http_port>8123</http_port>
    <tcp_port>9001</tcp_port>
    <mysql_port>9004</mysql_port>
    <postgresql_port>9005</postgresql_port>
    <interserver_http_port>9009</interserver_http_port>
    <listen_host>::</listen_host>
    <path>/var/lib/clickhouse/</path>
    <tmp_path>/var/lib/clickhouse/tmp/</tmp_path>
    <user_files_path>/var/lib/clickhouse/user_files/</user_files_path>

节点1（节点2的config2.xml与这个相同） config2.xml
    <logger>
        <level>trace</level>
        <log>/var/log/clickhouse-server2/clickhouse-server.log</log>
        <errorlog>/var/log/clickhouse-server2/clickhouse-server.err.log</errorlog>
        <size>1000M</size>
        <count>10</count>
    </logger>

    <http_port>8124</http_port>
    <tcp_port>9002</tcp_port>
    <mysql_port>9010</mysql_port>
    <postgresql_port>9011</postgresql_port>
    <interserver_http_port>9012</interserver_http_port>
	<listen_host>::</listen_host>
    <path>/var/lib/clickhouse2/</path>
    <tmp_path>/var/lib/clickhouse2/tmp/</tmp_path>
    <user_files_path>/var/lib/clickhouse2/user_files/</user_files_path>

这里需要留意的是两个点，一个是端口的设置，设置端口前可以用lsof -i:port命令来查端口使用情况。如果没有任何提示信息则表明端口未被使用。另一个要留意的则是config2.xml中新增了/var/lib/clickhouse2文件夹和/var/log/clickhouse-server2文件夹，如果启动的时候报文件夹不存在或上述的用户访问权限问题，则可以先通过mkdir以及chown -R命令来创建和更改文件访问用户。我是先建立的文件夹然后再更改用户访问，所以启动的时候没有遇到访问限制。

4.2、clickhouse和zookeeper集群配置
这里需要留意的是clickhouse副本和分片的定义问题，通过配置可以看到，分片shard里面直接就是副本replica的信息，简单理解为分片由副本组成，所以双分片双副本也可以简单看做两分片一副本。

所有配置文件中相同
    <remote_servers>
      <!-- 集群名称，可以自定义修改 -->
      <ck_2shard_2replica_cluster>
		<shard>
                <!-- 每个分片的写入权重值，数据写入时会有较大概率落到weight值较大的分片，这里全        
                     部设为1,即所有分片写入的概率相同 -->
                <weight>1</weight>
                <!-- 是否启用内部复制。true 代表写入数据时选择第一个健康的副本进行写入，其余
				副本以该表本身进行复制，保证复制表的一致性。false(默认) 代表将数据直接写入所
				有副本，如果有节点数据出现不一致，将不会自动修复 -->
                <internal_replication>true</internal_replication>
                <replica>
                    <host>node2</host>
                    <port>9001</port>
                    <user>default</user>
                    <password></password>
                </replica>
                <replica>
                    <host>node3</host>
                    <port>9002</port>
                    <user>default</user>
                    <password></password>
                </replica>
            </shard>
			<shard>
                <weight>1</weight>
                <internal_replication>true</internal_replication>
                <replica>
                    <host>node3</host>
                    <port>9001</port>
                    <user>default</user>
                    <password></password>
                </replica>
                <replica>
                    <host>node2</host>
                    <port>9002</port>
                    <user>default</user>
                    <password></password>
                </replica>
            </shard>
	  </ck_2shard_2replica_cluster>
    </remote_servers>
    <zookeeper>
        <node>
            <host>node1</host>
            <port>2181</port>
        </node>
        <node>
            <host>node2</host>
            <port>2181</port>
        </node>
        <node>
            <host>node3</host>
            <port>2181</port>
        </node>
    </zookeeper>

4.3、宏定义
可以简单理解为一种全局变量，使用时可以仅使用变量名，clickhouse服务器会替换成我们设定的变量值，目前用的最多的就是定义分片副本宏变量，然后再创建副本表时使用。

节点1 config.xml
    <!-- 宏定义,子标签有：
	         1、{layer} - ClickHouse集群的昵称，用于区分不同集群之间的数据。
			 2、{shard} - 分片编号或符号引用。
			 3、{replica} - 副本的名称（唯一），通常与主机名匹配,macros为可选定义。
	-->
    <macros>
        <shard>01</shard>
        <replica>01-1</replica>
    </macros>
节点1 config2.xml
    <macros>
        <shard>02</shard>
        <replica>02-2</replica>
    </macros>
节点2 config.xml
    <macros>
        <shard>02</shard>
        <replica>02-1</replica>
    </macros>
节点2 config2.xml
    <macros>
        <shard>01</shard>
        <replica>01-2</replica>
    </macros>

6、验证集群是否被定义好
每个节点分别执行下面两条命令，将4个实例启动起来：
????????clickhouse-server --config-file=/etc/clickhouse-server/config.xml
????????clickhouse-server --config-file=/etc/clickhouse-server/config2.xml

通过clickhouse-client --port 9001进入任一节点实例，通过如下命令查看已定义集群信息：
????????select * from system.clusters;
出现下图则说明两分片两副本的集群正常定义和加载：

?7、验证集群副本能力

首先建立具有副本能力的ReplicatedMergeTree引擎表：
????create table goods3_cluster on cluster ck_2shard_2replica_cluster(
? ? ? ? id int,
? ? ? ? name String,
? ? ? ? price int
? ? )ENGINE = ReplicatedMergeTree('/clickhouse/tables/{shard}/default/goods3_cluster','{replica}')
? ? ORDER BY id
然后插入一条测试数据：
? ? ?insert into goods3_cluster values(1,'92号牛奶',88)
在当前节点查询：