IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> Doris导入数据的方式 -> 正文阅读

[大数据]Doris导入数据的方式

1. 通过命令导入csv数据

1.0 建表语句

mysql>  CREATE TABLE `wudl_doris` (
    ->    `id` int NULL COMMENT "",
    ->    `name` int NULL COMMENT "",
    ->    `address` string NULL COMMENT "",
    ->    `city` varchar(2000) NULL COMMENT "",
    ->    `phone` varchar(200) NULL COMMENT ""
    ->  ) ENGINE=OLAP
    ->  DUPLICATE KEY(`id`)
    ->  COMMENT "flink sink  测试表"
    ->  DISTRIBUTED BY HASH(`id`) BUCKETS 1
    ->  PROPERTIES (
    ->  "replication_num" = "3",
    ->  "in_memory" = "false",
    ->  "storage_format" = "V2"
    ->  );
Query OK, 0 rows affected (0.01 sec)

mysql> select * from wudl_doris;
Empty set (0.02 sec)

mysql> show create table wudl_doris;
+------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| Table      | Create Table                                                                                                                                                                                                                                                                                                                                                                                                                              |
+------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
| wudl_doris | CREATE TABLE `wudl_doris` (
  `id` int(11) NULL COMMENT "",
  `name` int(11) NULL COMMENT "",
  `address` text NULL COMMENT "",
  `city` varchar(2000) NULL COMMENT "",
  `phone` varchar(200) NULL COMMENT ""
) ENGINE=OLAP
DUPLICATE KEY(`id`)
COMMENT "flink sink  测试表"
DISTRIBUTED BY HASH(`id`) BUCKETS 1
PROPERTIES (
"replication_allocation" = "tag.location.default: 3",
"in_memory" = "false",
"storage_format" = "V2"
);    |
+------------+-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

mysql> select * from wudl_doris;
+------+------+---------------+------------+---------------+
| id   | name | address       | city       | phone         |
+------+------+---------------+------------+---------------+
|    1 |    2 | '广东省'      | '深圳'     | '18575697660' |
|    2 |    2 | '广东省01'    | '深圳01'   | '18575697660' |
+------+------+---------------+------------+---------------+
2 rows in set (0.01 sec)

mysql> 

1.1 文件内容:

-rw-r--r-- 1 root root        25 12 22:11 test.csv 
[root@node01 datas]# vi test.csv 

2,3,'广东省03','深圳03','18575697660'

参数说明: 1. 分隔符 : column_separator:,"— 表示就用逗号(,) 分割。

1.2 导入命令

curl --location-trusted -u root -T test.csv -H "label:testdoris111" -H "column_separator:," -XPUT http://192.168.1.161:8090/api/wudldb/wudl_doris/_stream_load

[root@node01 datas]# curl --location-trusted -u root -T test.csv -H "label:testdoris111" -H "column_separator:," -XPUT http://192.168.1.161:8090/api/wudldb/wudl_doris/_stream_load
Enter host password for user 'root':
{
    "TxnId": 12025,
    "Label": "testdoris111",
    "Status": "Success",
    "Message": "OK",
    "NumberTotalRows": 1,
    "NumberLoadedRows": 1,
    "NumberFilteredRows": 0,
    "NumberUnselectedRows": 0,
    "LoadBytes": 44,
    "LoadTimeMs": 27,
    "BeginTxnTimeMs": 0,
    "StreamLoadPutTimeMs": 1,
    "ReadDataTimeMs": 0,
    "WriteDataTimeMs": 9,
    "CommitAndPublishTimeMs": 15
}

2. json 格式的文件内容导入

2.1 文件内容

[root@node01 datas]# vi doris.json

{"address":"广东省","city":"陕西","id":5,"name":5,"phone":"13004214933"}

2.2 命令:

命令:
curl --location-trusted -u root -T doris.json -H “label:testdoris1sdfa” -H “format:json” -H “column_separator:,” -XPUT http://192.168.1.161:8090/api/wudldb/wudl_doris/_stream_load

[root@node01 datas]# curl --location-trusted -u root -T doris.json -H "label:testdoris1sdfa"  -H "format:json" -H "column_separator:," -XPUT http://192.168.1.161:8090/api/wudldb/wudl_doris/_stream_load
Enter host password for user 'root':
{
    "TxnId": 12028,
    "Label": "testdoris1sdfa",
    "Status": "Success",
    "Message": "OK",
    "NumberTotalRows": 1,
    "NumberLoadedRows": 1,
    "NumberFilteredRows": 0,
    "NumberUnselectedRows": 0,
    "LoadBytes": 79,
    "LoadTimeMs": 33,
    "BeginTxnTimeMs": 0,
    "StreamLoadPutTimeMs": 1,
    "ReadDataTimeMs": 0,
    "WriteDataTimeMs": 5,
    "CommitAndPublishTimeMs": 25
}
[root@node01 datas]# 

2.3 查询结果

mysql> select * from wudl_doris;
+------+------+---------------+------------+---------------+
| id   | name | address       | city       | phone         |
+------+------+---------------+------------+---------------+
|    1 |    2 | '广东省'      | '深圳'     | '18575697660' |
|    2 |    2 | '广东省01'    | '深圳01'   | '18575697660' |
|    5 |    5 | 广东省        | 陕西       | 13004214933   |
+------+------+---------------+------------+---------------+
3 rows in set (0.01 sec)

mysql> 

代码操作********************************

[root@node01 datas]# curl --location-trusted -u root -H "format: json" -H "strip_outer_array: true" -H "jsonpaths: [\"$.address\",\"$.city\",\"$.id\",\"$.name\",\"$.phone\"]" -T data.json http://192.168.1.161:8090/api/wudldb/wudl_doris01/_stream_load
Enter host password for user 'root':
{
    "TxnId": 14040,
    "Label": "420d13d2-533c-4498-94f1-8c4d966c1335",
    "Status": "Success",
    "Message": "OK",
    "NumberTotalRows": 3,
    "NumberLoadedRows": 3,
    "NumberFilteredRows": 0,
    "NumberUnselectedRows": 0,
    "LoadBytes": 304,
    "LoadTimeMs": 27,
    "BeginTxnTimeMs": 0,
    "StreamLoadPutTimeMs": 1,
    "ReadDataTimeMs": 0,
    "WriteDataTimeMs": 6,
    "CommitAndPublishTimeMs": 18
}
[root@node01 datas]# 

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-01-04 13:29:40  更:2022-01-04 13:29:55 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 -2025/1/17 4:09:02-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码