显示当前会话有多少函数可用 :
SHOW FUNCTIONS;
显示函数的描述信息 :
DESC FUNCTION concat;
1) UDF:操作单个数据行,产生单个数据行。
2) UDAF:操作多个数据行,产生一个数据行。
3) UDTF:操作一个数据行,产生多个数据行一个表作为输出。
第一步:继承UDF或者UDAF或者UDTF,实现特定的方法(如:evalute方法,但该方法不存在于UDF中,Hive会检查用户的UDF是否拥有一个evalute方法)。
第二步:将写好的类打包为jar。如Hivefirst.jar。
第三步:进入到Hive外壳环境中,利用add jar /home/hadoop/Hivefirst.jar 注册该jar文件。
第四步:为该类起一个别名,create temporary function mylength as 'com.whut.StringLength';这里注意UDF只是为这个Hive会话临时定义的。
第五步:在select中使用mylength()。
方式1:修改源码添加相应的函数类,然后在修改ql/src/java/org/apache/hadoop/hive/ql/exec/FunctionRegistry.java类,
添加相应的注册函数代码registerUDF("parse_url",UDFParseUrl.class,false);
方式2:hive -i ‘file’
方式3:新建hiverc文件
1、jar包放到安装日录下或者指定目录下
2、${HIVE_HOME}/bin目录下有个.hiverc文件,它是隐藏文件。
3、把初始化语句加载到文件中
vi .hiverc
add jar /liguodong/UDFTest.jar;
create temporary function bigthan as 'UDFDemo.UDFTest';
然后打开hive时,它会自动执行.hiverc文件。
|