Hbase过滤器
1,定义
过滤器就是对数据处理,过滤掉一些没用或者不需要的数据,在MySql中就相当于
where xxx>xxx的作用
要使用这个就得先确定三个条件:
1,比较的规则,是大于还是小于,还是等于
2,比较的内容是什么,和比较的形式,比如:字符串,整数,当然hbase就是字节数组。
3,按照什么比较,比如rowkey,familycolumn等
hbase中没有大于小于号,用常量的形式代表,
至于比较的内容和比较的形式在hbase中是用比较器解决的
按照什么比较,这个就是用具体的封装的过滤器了
2,比较规则(符号)
LESS <
LESS_OR_EQUAL <=
EQUAL =
NOT_EQUAL !=
GREATER >
GREATER_OR_EQUAL >=
NO_OP 排除所有
3,比较器
总共有6种
BinaryComparator 字节
BinaryRrefixComparator 字节前缀
BitComparator 位
SubstringComparator 子串
RegexStringComparator 正则
NullComparator 空
4,过滤器
分为两类:基础过滤器,专用过滤器
区别就是:一个是就按照一个条件,另一个就按照两个或多个条件过滤
一,基础过滤器(五种)
RowFilter 行键过滤器
FamilyFilter 列族过滤器
QualifierFilter 列过滤器
ValueFilter 值过滤器
TimestampsFilter 时间戳过滤器
二,专用过滤器()
单列值过滤器 SingerColumnValueFilter
单列值排除过滤器 SingerColumnValueExcludeFilter
(行)前缀过滤器 prefixFilter
列前缀过滤器 ColumnPrefixFilter
分页过滤器 PageFilter
过滤器列表 FilterList
|