Hive中自定义函数的使用

用java代码编写,继承UDF类即可

然后打包,导入hive中,再创建个函数名就能使用

bash 复制代码
hive: add jar '/路径/xxx.jar';
hive: create function 函数名 as '主类名';

以下用计算地球间两点的距离的为例

java 复制代码
import org.apache.hadoop.hive.ql.exec.UDF;

public class CalculateLength extends UDF {
    /**
     * 地球半径
     */
    private static final double EARTH_RADIUS = 6378137;

    /**
     * 计算两个经纬度之间的距离
     *
     * @param longi1 经度1
     * @param lati1  纬度1
     * @param longi2 经度2
     * @param lati2  纬度2
     * @return 距离
     */
    public double evaluate(double longi1, double lati1, double longi2, double lati2) {
        double lat21 = lati1 * Math.PI / 180.0;
        double lat22 = lati2 * Math.PI / 180.0;
        double a = lat21 - lat22;
        double b = (longi1 - longi2) * Math.PI / 180.0;
        double sa2 = Math.sin(a / 2.0);
        double sb2 = Math.sin(b / 2.0);
        double d = 2 * EARTH_RADIUS * Math.asin(Math.sqrt(sa2 * sa2 + Math.cos(lat21) * Math.cos(lat22) * sb2 * sb2));
        return Math.abs(d);
    }
}
相关推荐
weixin_457297106 小时前
Hadoop面试题
大数据·hadoop·分布式
何亚告6 小时前
记一次项目上hadoop数据迁移
大数据·hadoop·分布式
默默在路上7 小时前
apache-hive-3.1.3 show databases;报错
hive·hadoop·apache
talle20217 小时前
Hadoop分布式计算框架【MapReduce】
大数据·hadoop·mapreduce
QQ12958455047 小时前
SSAS - 步骤一:通过VS2022新建项目
数据仓库·数据分析
走遍西兰花.jpg7 小时前
Oracle,hive,gaussdb的区别
hive·oracle·gaussdb
Francek Chen21 小时前
【大数据基础】大数据处理架构Hadoop:01 Hadoop概述
大数据·hadoop·分布式·架构
無森~1 天前
实战:单词数量统计案例
大数据·hadoop
梦痕长情1 天前
记一次hiveSQL 查询无数据,String类型的字段自动转化为int类型的经历和解决方案
hive
weixin_462446231 天前
Hadoop / YARN / Hive 运维操作教程
运维·hive·hadoop