IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> GBase 8a MPP Cluster Kerberos 安全认证下的 HDFS 文件操作 -> 正文阅读

[大数据]GBase 8a MPP Cluster Kerberos 安全认证下的 HDFS 文件操作

1. GBase 8a MPP Cluster 集群安装 Kerberos 客户端

Kerberos 客户端的安装与配置主要分为以下几个步骤:

  • 在 GBase 8a MPP Cluster 的所有集群节点上,安装 Kerberos 客户端安装包,再将 Kerberos 客户端配置文件 /etc/krb5.conf 由 KDC 服务器复制到所有集群节点上的 /etc 目录下;
  • GBase 8a MPP Cluster 集群通过 kerberos 认证加载或者导出 HDFS 文件,要求 Kerberos 安装包的最低版本为 1.10;如检测到当前 Kerberos 版本低于1.10,会在 express.log 日志中打印 Kerberos version too old, require 1.10 or higher 信息;
  • 将 Kerberos 认证密钥文件 keytab 复制到所有节点指定目录,Coordinate 节点目录为 $GCLUSTER_BASE/config,data 节点目录为 $GBASE_BASE/config
  • 将 HTTPS 的 CA 根证书文件追加到所有节点的根证书文件中,其中 CA 根证书文件中包含一个或多个证书。
    Coordinate 节点根证书文件为:$GCLUSTER_BASE/config/ca-bundle.crt
    data 节点根证书文件为:$GBASE_BASE/config/ca-bundle.crt

2. 加载/导出 Kerberos 认证下 HDFS 文件

HDFS 中集成了 Kerberos 安全认证情况下,GBase 8a MPP Cluster 节点部署 Kerberos 客户端后,即可以执行加载或导出 Kerberos 认证下的 HDFS 文件。加载或导出操作需完成如下配置:

  • 设置 gbase_hdfs_auth_mode=kerberos,指定使用 Kerberos 认证方式连接 HDFS。
  • 设置 gbase_hdfs_protocol=http/https/rpc,指定使用 HTTP/HTTPS/RPC 协议连接 HDFS。
  • 设置 gbase_hdfs_principal="xxx",指定 Kerberos 认证主体。
  • 设置 gbase_hdfs_keytab='xxx',指定 keytab 文件路径。

以上配置完成后,即可进行加载导出操作。

执行加载导出前的配置需要注意:

  • HDFS 的 HTTP 端口号默认为 50070,HTTPS 端口号默认为 50470,RPC 端口号默认为 9000,三种协议的端口不同,在加载或导出 SQL 的 URL 中的端口需要与指定的协议一致。
  • 使用 HTTPS 协议连接 HDFS 时,因为客户端需要使用 CA 根证书对 HTTPS 地址进行验证,所以在加载或导出 SQL 的 URL 中,指定的 HDFS NameNode 的主机名(或地址)必须与 CA 签名的主机名(或地址)完全相同。
  • 当不指定 gbase_hdfs_keytab 参数值或指定的参数值为空字符串时,将使用 gbase_hdfs_principal 推定 keytab 文件名,此时应将 keytab 文件复制到 config 目录下,keytab 文件的名称应与 gbase_hdfs_principal 参数值对应,例如:
    set gbase_hdfs_principal='gbase/namenode@HADOOP.COM',则 config 目录下 keytab 文件名应为:gbase_namenode.kt
  • 由于 Hadoop 和 Kerberos 对 DNS 解析依赖程度很高,需要 DNS 支持正向(forward)和反向(reverse)查找,在 Kerberos 认证环境中在加载和导出语句的 URL 中推荐使用主机名,而不建议使用 IP 地址。
  • 多套带不同 kerberos 认证的 hadoop 集群导入导出时配置
    • 多套 kerberos 配置文件合并(多个 kerberos server 的 krb5 文件合并放在 /etc 目录下);
    • Kerberos 相关的其他文件有多个就将多个都放到对应目录下,如多个keytab 放到对应 config 目录下,多个 CA 证书也放到对应 config 下;
    • GBase 8a 集 群 导 入 导 出 hadoop 的 相 关 参 数 目 前 只 有 gbase_hdfs_namenodes 支持写多套 hadoop 集群,其他参数只支持一套hadoop 集群,所以 GBase 的 hadoop 参数通过 session 级参数动态配置,也可以用 url 的参数方式写在 gbase_hdfs_namenodes 里;
    • 由于 GBase 8a 是通过 api 访问 kdc,所以不需要使用 kinit 初始化 kerberos 客户端。

3. GBase 8a MPP Cluster 安装 Kerberos 认证的影响

  • 集群扩容影响
    支持 Kerberos 认证的集群版本在执行扩容后,管理员需要执行 Kerberos 客户端安装与配置,手工完成 Kerberos 客户端环境部署。
  • 集群升级影响
    从不支持 Kerberos 认证的集群版本到支持 Kerberos 认证的集群版本的升级,管理员需要执行 Kerberos 客户端安装与配置,手工完成 Kerberos 客户端环境部署。
  • 集群节点替换工具
    支持 kerberos 认证的集群版本的节点替换功能。集群节点替换工具在同步文件时,需要将 $GCLUSTER_BASE/config$GBASE_BASE/config 下扩展名为 .kt.pem / .crt / .cer / .crl 的文件同步到被替换节点。
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-09-04 01:18:22  更:2022-09-04 01:18:43 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 10:40:01-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码