IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 使用GeoMesa实现时空索引并进行KNN查询 -> 正文阅读

[大数据]使用GeoMesa实现时空索引并进行KNN查询

安装geomesa-hbase

  • 版本:geomesa-hbase_2.11-3.4.0-bin.tar.gz

  • 解压到指定目录后为其添加环境变量

    export GEOMESA_HBASE_HOME=/home/hadoop/geomesa-hbase_2.11-3.4.0
    export PATH=$PATH:$GEOMESA_HBASE_HOME/bin
    

    在这里插入图片描述

  • 部署GeoMesa-HBase分布式运行jar

    geomesa-hbase需要使用本地过滤器来加速查询,因此需要将GeoMesa的runtime JAR包,拷贝到HBase的库目录下。

    cp ./dist/hbase/geomesa-hbase-distributed-runtime-hbase1_2.11-3.4.0.jar /home/hadoop/hbase/lib/
    
  • 注册协处理器

    GeoMesa利用服务器端处理来加速某些查询。具体实现:

    在HBase的配置文件hbase-site.xml添加如下内容:

    <property>
      <name>hbase.coprocessor.user.region.classes</name>
      <value>org.locationtech.geomesa.hbase.coprocessor.GeoMesaCoprocessor</value>
    </property>
    
  • 设置命令行工具

    将HBase配置文件hbase-site.xml打包进geomesa-hbase-datastore_2.11-$VERSION.jar中:

    zip -r lib/geomesa-hbase-datastore_2.11-hbase1_2.11-3.4.0.jar /home/hadoop/hbase/conf/hbase-site.xml
    

    在这里插入图片描述

  • 进入到${GEOMESA_HBASE_HOME},运行:

    ./bin/install-shapefile-support.sh
    

    在这里插入图片描述

  • 测试是否安装成功

    geomesa-hbase version
    

    在这里插入图片描述

时空索引

导入数据相关链接:GeoMesa命令行,索引概述_爱是与世界平行-程序员信息网 - 程序员信息网 (i4k.xyz)

导入数据官方链接:8.3. Ingest Commands — GeoMesa 3.2.2 Manuals

定义特征类型官方链接:[8.6. Defining Simple Feature Types — GeoMesa 3.2.2 Manuals](https://www.geomesa.org/documentation/3.2.2/user/cli/sfts.html#cli-sft-conf)

转换器官方链接:9. GeoMesa Convert — GeoMesa 3.2.2 Manuals

  • 数据准备

    在${GEOMESA_HBASE_HOME}下新建data目录,进入data目录创建data.csv文件

    AAA,red,113.918417,22.505892,2017-04-09T18:03:46
    BBB,white,113.960719,22.556511,2017-04-24T07:38:47
    CCC,blue,114.088333,22.637222,2017-04-23T15:07:54
    DDD,yellow,114.195456,22.596103,2017-04-21T21:27:06
    EEE,black,113.897614,22.551331,2017-04-09T09:34:48
    
  • 定义特征类型
    在这里插入图片描述

    geomesa = {
      sfts = {
        example = {
          type-name = "example"
          attributes = [
            { name = "carid", type = "String", index = true }
            { name = "color", type = "String", index = false }
            { name = "double_0", type = "Double", index = false }
            { name = "double_1", type = "Double", index = false }
            { name = "time", type = "Date",   index = false }
            { name = "geom", type = "Point",  index = true,srid = 4326,default = true }
       ]
        }
      }
    }
    
  • 定义转换器
    在这里插入图片描述

    geomesa.converters.example = {
        "fields" : [
            {
                "name" : "carid",
                "transform" : "toString($1)"
            },
            {
                "name" : "color",
                "transform" : "toString($2)"
            },
            {
                "name" : "double_0",
                "transform" : "toDouble($3)"
            },
            {
                "name" : "double_1",
                "transform" : "toDouble($4)"
            },
            {
                "name" : "time",
                "transform" : "isoDateTime($5)"
            },
            {
                "name" : "geom",
                "transform" : "point($double_0,$double_1)"
            }
        ],
        "format" : "CSV",
        "id-field" : "md5(string2bytes($0))",
        "options" : {
            "encoding" : "UTF-8",
            "error-mode" : "skip-bad-records",
            "parse-mode" : "incremental",
            "validators" : [
                "index"
            ]
        },
        "type" : "delimited-text"
    }
    
  • 导入数据

    geomesa-hbase ingest --catalog geomesa01 \
    	--feature-name cars20 \
    	--input-format csv \
    	-C conf/testconvertor.convert \
    	-s conf/myschema.sft \
    	"data/data.csv"
    

    在这里插入图片描述

  • 进入hbase shell查看导入的数据

    Z2/Z3指示了Geomesa的索引方式(Z2:空间索引;Z3:时空索引)

    索引官方链接:7.3. Index Basics — GeoMesa 3.2.2 Manuals
    在这里插入图片描述

    scan 'geomesa01_cars20_z3_geom_time_v7'
    

    在这里插入图片描述

KNN查询

  • 将GeoSparkModified解压到指定目录,此处为 /home/hadoop/compress/

  • 使用geospark.jar作为依赖项运行Spark shell

    spark-shell --jars /home/hadoop/compress/GeoSparkModified-master/classes/artifacts/geospark_jar/geospark.jar
    

    在这里插入图片描述

  • 导包运行KNN查询代码

    /home/hadoop/compress/GeoSparkModified-master/src/test/resources/arealm.csv文件中含有121960条经纬度

    import org.datasyslab.geospark.spatialOperator.KNNQuery
    import org.datasyslab.geospark.spatialRDD.PointRDD;
    import com.vividsolutions.jts.geom.GeometryFactory;
    import com.vividsolutions.jts.geom.Point;
    import com.vividsolutions.jts.geom.Coordinate;
    
    val fact=new GeometryFactory();
    val queryPoint=fact.createPoint(new Coordinate(-109.73, 35.08)); //查询点
    val objectRDD = new PointRDD(sc, "file:///home/hadoop/compress/GeoSparkModified-master/src/test/resources/arealm.csv", 0, "csv");
    val resultSize = KNNQuery.SpatialKnnQuery(objectRDD, queryPoint, 5); //查询邻近查询点的5个点
    

    在这里插入图片描述

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-06-01 15:18:23  更:2022-06-01 15:19:13 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/23 20:59:26-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码