前言
前段时间在学习hive,之前是通过hue进行编程的,但是由于设备问题,网络连接不顺畅,使用感很不好,又不想再安装客户端了,于是学习了一下怎么在虚拟机中执行hive命令并作了简单的记录。
前期准备
配置hive环境
启动hive
[hadoop@node100 hadoop]$ start-all.sh
[hadoop@node100 hadoop]$ cd /opt/module/apache-hive-3.1.1-bin
[hadoop@node100 apache-hive-3.1.1-bin]$ hive
hive(default)>
创建数据库
hive(default)> create database if not exists 数据库名;
hive(default)> show databases;
在新建数据库下建表
hive(default)> use 新建数据库名;
hive(新建数据库名)> create table 表名 (字段1 字段1数据类型,字段2 字段2数据类型,……,字段n 字段n数据类型) row format delimited fields terminated by ',';
导入数据
通过XFTP将数据文件上传至虚拟机中,教程链接
hive(新建数据库名)> load data local inpath '数据路径' overwrite into table 表名;
查询
hive(新建数据库名)> select 字段1,……,字段n from 表名;
关闭hive和集群
hive(default)> exit;
[hadoop@node100 apache-hive-3.1.1-bin]$ stop-all.sh
[hadoop@node100 apache-hive-3.1.1-bin]$ exit
[root@node100 ~]$ poweroff
推荐
另外,推荐一篇博客《HIVE的常用操作-建库和表-插入数据》,这篇博客中对加载数据方式的介绍更加详细。
|