IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Sqoop安装 -> 正文阅读

[大数据]Sqoop安装


一、Sqoop安装

1.1下载并解压

1)下载地址:http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/

wget http://mirrors.hust.edu.cn/apache/sqoop/1.4.6/sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz
# 解压
tar -zvxf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /usr/local/sqoop

1.2 修改配置文件

1)重命名配置文件

$ mv /usr/local/sqoop/conf/sqoop-env-template.sh /usr/local/sqoop/conf/sqoop-env.sh
  1. 添加环境变量
vi /etc/profile 
# 添加如下内容
SQOOP_HOME=/usr/local/sqoop-1.4.7
PATH=$PATH:$SQOOP_HOME/bin
export PATH SQOOP_HOME

# 生效
source /etc/profile

1.3拷贝JDBC驱动

# 这里拷贝hive/lib目录下的jar包
# 注意自己mysql的版本
cp /usr/local/hive/lib/mysql-connector-java-8.0.15.jar 
 /usr/local/sqoop-1.4.7/lib/

1.4 验证sqoop

输入sqoop命令验证

sqoop help

二、Sqoop的简单使用

2.1 导入数据

在Sqoop中,“导入”概念指:从非大数据集群(RDBMS)向大数据集群(HDFS,HIVE,HBASE)中传输数据,叫做:导入,即使用import关键字

2.2 从RDBMS到HDFS在这里插入代码片

1)全部导入

$ bin/sqoop import \
--connect jdbc:mysql://hostname:3306/test \
--username root \
--password password \
--table staff \
--target-dir /user/test\
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t"

2)查询导入

#如果query后使用的是双引号,则$CONDITIONS前必须加转移符,防止shell识别为自己的变量。
$ bin/sqoop import \
--connect jdbc:mysql://hostname:3306/test \
--username root \
--password password \
--target-dir /user/test\
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--query 'select name,sex from staff where id <=1 and $CONDITIONS;'

3)导入指定列

#c olumns中如果涉及到多列,用逗号分隔,分隔时不要添加空格
$ bin/sqoop import \
--connect jdbc:mysql://hostname:3306/test \
--username root \
--password password \
--target-dir /user/test \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--columns id,sex \
--table staff

4)使用sqoop关键字筛选查询导入数据

$ bin\sqoop import \
--connect jdbc://mysql/hostname:3306/test \
--username root \
--password password \
--target-dir /user/test \
--delete-target-dir \
--num-mappers 1 \
--fields-terminated-by "\t" \
--table staff \
--where "id=1"

2.2导出数据

1)HIVE/HDFS到RDBMS

$ bin/sqoop export \
--connect jdbc:mysql://hostname:3306/test \
--username root \
--password password \
--table staff \
--num-mappers 1\
--export-dir /user/staff_hive \
--input-fields-terminated=by "\t"
  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2021-08-20 15:11:21  更:2021-08-20 15:13:36 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 13:12:39-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码