| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 大数据 -> elasticsearch的安装使用 -> 正文阅读 |
|
[大数据]elasticsearch的安装使用 |
elasticsearch数据获取:????????1:爬虫获取数据 ????????2:从关系型数据库同步数据 ????????涉及到ES使用方式 数据存储:????????es是一种类似于非关系型数据库的方式存放数据 ????????数据存储结构类似mongodb文档结构,但是比mongodb更为复杂处理 ????????涉及到数据分词,倒排等相关操作 数据检索:????????全文搜索 ????????高亮搜索 ????????条件搜索 应用场景????????1、社会化搜索 ????????2、实时搜索 ????????3、移动搜索 ????????4、个性化搜索 ????????5、地理位置感知搜索 ????????6、跨语言搜索 ????????7、多媒体搜索 ????????8、情境搜索 我们建立一个网站或应用程序,并要添加搜索功能,但是想要完成搜索工作的创建是非常困难的。我们希望搜索解决方案要运行速度快,我们希望能有一个零配置和一个完全免费的搜索模式,我们希望能够简单地使用JSON通过HTTP来索引数据,我们希望我们的搜索服务器始终可用,我们希望能够从一台开始并扩展到数百台,我们要实时搜索,我们要简单的多租户,我们希望建立一个云的解决方案。因此我们利用Elasticsearch来解决所有这些问题及可能出现的更多其它问题。 适用场景: 1>海量数据分析引擎 2>站内搜索引擎 3>数据仓库 一线公司使用: 英国卫报-实时分析公众对文章的回应 维基百科,github - 站内实时搜索 百度-实时日志监控平台 阿里 google 京东 小米 华为 elasticsearch的安装使用ES服务器1:Java编写的解压即用的软件,只需要有Java的运行环境即可,把压缩包解压后,进入到bin目录运行elasticsearch.bat 2:浏览器输入:http://localhost:9200,看到浏览器输出服务器的信息,表示安装成功,可以使用了 ????????1.x、2.x、5.x、6.x、7.x。注意没有3, 4原因:elk 技术整合版本选择:最先版本 7.x 6.x 都可以 ES可视化客户端-head--观察ES数据????????Elasticsearch默认的客户端工具是命令行形式的,操作起来不方便,也不直观看到数据的展示,所以我们需要去安装一个可视化插件,但是这些插件都是基于H5开发的,在谷歌的应用商店中找到**elasticsearch-head**插件,然后安装,使用该插件能比较直观的展示服务器中的数据。需要安装到谷歌浏览器。(首先需要把开发者模式开启,然后加载插件,选中head所在的目录) ES操作客户端-kibana----操作ES数据????????步骤1:下载kibana ????????????????https://www.elastic.co/cn/downloads/kibana ????????????????注意:版本必须跟es一致 ????????步骤2:修改配置 ????????????????根/config/kibana.yml ????????????????都是默认情况,可以不用修改 ????????步骤3:启动kibana ????????????????根/bin/kibana ????????步骤4:访问客户端 ????????????????http://localhost:5601 分词器????????直接把压缩文件中的内容解压,然后放在elasticsearch/plugins下,然后重启即可 用于检索时,通过分词器,找到是否有对应的中文词组,有则按此进行搜索。如:英特尔,如果不适用分词器,搜索的会是按照 英, 特, 尔, 分开进行搜索 简单使用核心概念elasticsearch的存储结构为索引(index),类型(type),文档(document),列(field)。类似关系数据库对应的数据库(database),表(table),数据行(row),数据列(Colum) 常规操作添加
查看
删除:语法:DELETE /索引名 设置映射(列)创建
查看
文档操作数据类型https://www.jianshu.com/p/01f489c46c38 有很多很多 核心类型: text 类型:当一个字段是要被全文搜索的,比如Email内容、产品描述,应该使用text类型。设置text类型以后,字段内容会被分析,在生成倒排索引以前,字符串会被分析器分成一个一个词项。text类型的字段不用于排序,很少用于聚合。 keyword类型:适用于索引结构化的字段,比如email地址、主机名、状态码和标签。如果字段需要进行过滤(比如查找已发布博客中status属性为published的文章)、排序、聚合。keyword类型的字段只能通过精确值搜索到。 数值 类型:byte、short、integer、doule、float、date类型、boolean类型、binary类型、array类型、object类型、ip类型 文档的基本操作文档添加:
文档更新:
文档查看:
文档删除:
全文搜索搜索语句: match
multi_match
中文分词器
拓展词库 ????????最简单的方式就是找到IK插件中的**config/main.dic**文件,往里面添加新的词汇,然后重启服务器即可 倒序索引: ????????倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文件,简称倒排文件(inverted file) https://blog.csdn.net/starzhou/article/details/87519973 高亮显示
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 | -2024/11/23 22:51:36- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |