IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 大数据 -> 4.Logstash插件—输入插件&编码插件(Codec) -> 正文阅读

[大数据]4.Logstash插件—输入插件&编码插件(Codec)

4.1 标准输入(Stdin)

  • 配置示例
input {
  stdin {
    add_field => {"key" => "value"}
    codec => "plain"
    tags => ["add"]
    type => "std"
  } 
}

4.2 运行结果

  • 运行命令:bin/logstash -f stdin.conf
{
      "message" => "hello world",
    "@version" => "1",
  "@timestamp" => "2014-08-08T06:48:47.789Z",
      "type" => "std",
      "tags" => [
    [0] "add"
  ],
      "key" => "value",
      "host" => "raochenlindeMacBook-Air.local"
}

4.3 标准输入

  • type 和 tags 是 logstash 事件中两个特殊的字段
    • 通常来说会在输入区段中通过 type 来标记事件类型
    • 而 tags 则是在数据处理过程中,由具体的插件来添加或者删除的

4.4 读取文件(File)

  • Logstash 使用一个名叫 FileWatch 的 Ruby Gem 库来监听文件变化
    • 这个库支持 glob 展开文件路径
  • sincedb 文件中记录了每个被监听的文件的 inode, major number, minor number 和pos
  • 配置示例

4.4.1 读取文件(File)注意事项

  • 通常要导入原有数据进 Elasticsearch 的话,还需要 filter/date 插件来修改默认的"@timestamp" 字段值
  • FileWatch 只支持文件的绝对路径,而且会不自动递归目录
    • 所以有需要的话,就用数组方式都写明具体哪些文件
  • LogStash::Inputs::File 只是在进程运行的注册阶段初始化一个 FileWatch 对象
    • 所以它不能支持类似 fluentd 那样的 path => “/path/to/{+yyyy/MM/dd/hh}.log” 写法
    • 达到相同目的,你只能写成 path => “/path/to////.log”

4.5 读取网络数据(TCP)

  • 配置示例

4.6 常见场景

  • LogStash::Inputs::TCP 最常见的用法就是配合 nc 命令导入旧数据
    • 在启动 logstash 进程后,在另一个终端运行如下命令即可导入数据:
# nc 127.0.0.1 8888 < olddata

4.7 生成测试数据(Generator)

  • 配置示例
    • 插件的默认生成数据,message 内容可以根据自己的实际需要这里来写其他内容

4.8 读取 Syslog 数据

  • 配置示例
input {
   syslog {
     port => "514"
   }
}
  • Logstash 是用 UDPSocket, TCPServer 和 LogStash::Filters::Grok 来实现
    LogStash::Inputs::Syslog 的
    • 所以可以直接用 logstash 配置实现一样的效果:

4.8.1 读取 Syslog 数据最佳实践

  • 建议使用LogStash::Inputs::TCP和 LogStash::Filters::Grok 配合实现同样的 syslog 功能
    • 在同一个客户端数据的处理中,其 grok 和 date 是一直在该线程中完成的,这会导致总体上的处理性能几何级的下降
    • 拆分到 filters 阶段后,logstash 支持对该阶段插件单独设置多线程运行,大大提高了总体处理性能

大数据视频推荐:
CSDN
大数据语音推荐:
ELK7 stack开发运维
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通

  大数据 最新文章
实现Kafka至少消费一次
亚马逊云科技:还在苦于ETL?Zero ETL的时代
初探MapReduce
【SpringBoot框架篇】32.基于注解+redis实现
Elasticsearch:如何减少 Elasticsearch 集
Go redis操作
Redis面试题
专题五 Redis高并发场景
基于GBase8s和Calcite的多数据源查询
Redis——底层数据结构原理
上一篇文章      下一篇文章      查看所有文章
加:2022-03-15 22:37:17  更:2022-03-15 22:41:26 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/24 7:50:44-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码