hive

是阿威啊10 小时前
大数据·服务器·数据仓库·hive·hadoop
【用户行为归因分析项目】- 【企业级项目开发第二站】项目通用代码开发gitee代码仓地址:DataWareHouse: UserBehaviorAttributionAnalysis
大千AI助手12 小时前
hive·python·任务调度·airflow·模版·大千ai助手·hiveoperator
HiveOperator 中 hql 模板路径解析失败的原因分析本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
Hello.Reader12 小时前
数据仓库·hive·hadoop
Hive Dialect 的查询能力支持哪些 HiveQL 子集,怎么写、怎么跑Hive Dialect 主要覆盖 Hive 常用查询(DQL)的一个子集,核心包括:这意味着:你在 Hive 里常写的“聚合、排序、窗口、CTE、UDTF 展开”等大多数查询写法,在 Flink 的 Hive Dialect 下都能用。
是阿威啊1 天前
数据仓库·hive·hadoop
【用户行为归因分析项目】- 【企业级项目开发第三站】模拟DIM层设备、应用数据加载到Hivegitee代码仓地址:DataWareHouse: UserBehaviorAttributionAnalysis
小鸡脚来咯1 天前
hive·hadoop·sql
Hive SQL与SQL不同处注意:反斜杠要写两个斜杠,表示转义例:查找广东省的数据 SELECT * FROM itheima.orders WHERE useraddress RLIKE '.*广东.*'; 查找用户地址是:xx省 xx市 xx区的数据 SELECT * FROM itheima.orders WHERE useraddress RLIKE '..省 ..市 ..区'; 查找用户姓为张、王、邓 SELECT * FROM itheima.orders WHERE username RLIKE '[张王邓]\\S+'
宸津-代码粉碎机2 天前
java·数据仓库·hive·hadoop·python·技术文档编写
Spring 6.0+Boot 3.0实战避坑全指南:5大类高频问题与解决方案(附代码示例)摘要:Spring 6.0与Boot 3.0作为Java生态的里程碑式升级,引入了虚拟线程、声明式HTTP客户端等重磅特性,但在实战迁移与开发过程中,JDK适配、包名迁移、依赖冲突等问题频发。本文结合笔者实际项目经验,梳理了5大类高频问题,提供了可直接复用的解决方案与代码示例,助力开发者高效避坑、顺利升级。
`林中水滴`2 天前
hive
Hive系列:Hive 默认分隔符Hive 中的默认分隔符是 ^A (\001) ,这是一种特殊的分隔符,使用的是 ASCII 编码的值,键盘是打不出来的
yumgpkpm2 天前
数据库·人工智能·hive·hadoop·elasticsearch·数据挖掘·kafka
银行的数据智能平台和Cloudera CDP 7.3(CMP 7.3)的技术对接银行的数据智能平台和Cloudera CDP 7.3(CMP 7.3)的技术对接面向银行场景的、保姆级详细技术对接方案,涵盖从环境准备、安全合规、数据集成、模型开发到运维监控的全流程,适用于将银行自建的数据智能平台(Data Intelligence Platform)与 Cloud Data AI CMP 7.3 Private Cloud Base/Plus 进行深度集成。
`林中水滴`2 天前
hive
Hive系列:Hive 配置项详解hive.ddl.output.format:hive.exec.script.wrapper:hive.exec.plan:
`林中水滴`2 天前
hive
Hive系列:Hive 安装和配置将 apache-hive-3.1.2-bin.tar.gz 安装包上传到 node-01 的 /root 目录下并将其解压
Hello.Reader2 天前
大数据·hive·flink
Flink Catalogs 元数据统一入口、JDBC/Hive/自定义 Catalog、Time Travel、Catalog Store 与监听器Catalog 负责提供并管理元数据,例如:Catalog 的核心价值有两点:两个作用:注意点:Hive Metastore 会把 meta-object 名字存成小写,这和 GenericInMemoryCatalog 的大小写敏感不同(迁移/兼容时常踩坑)
Hello.Reader2 天前
大数据·hive·flink
Flink Modules 把自定义函数“伪装成内置函数”,以及 Core/Hive/自定义模块的加载与解析顺序你会遇到这些需求时,Module 非常合适Module 提供的对象被视为 Flink 的系统(built-in)对象,因此 没有 catalog/database 的 namespace。 也就是说,它们更像 core 里的 SUBSTRING、CAST 一类“全局可见”的东西。
是阿威啊2 天前
大数据·hive·hadoop·架构·spark·scala
【用户行为归因分析项目】- 【企业级项目开发第一站】项目架构和需求设计本次设计开发流程记录在专栏中,持续更新ing从零开始搭建大数据离线\实时项目【轻量级】_是阿威啊的博客-CSDN博客
飞Link3 天前
linux·hive·hadoop·sqoop
【Sqoop】Linux(CentOS7)下安装Sqoop教程用户:root密码:123456下载地址:https://archive.apache.org/dist/sqoop/1.4.7/sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz
飞Link3 天前
大数据·linux·数据仓库·hive·hadoop
【Hive】Linux(CentOS7)下安装Hive教程用户:root密码:123456添加以下内容分发文件下载地址:http://archive.apache.org/dist/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz
心止水j3 天前
hive
hbase 电商1(1) 创建 & 列出命名空间shell(2) 创建表 & 列出表shell(3) 增加列族shell
小鸡脚来咯3 天前
大数据·hive·性能优化
Hive分桶表:大数据开发的性能优化利器分桶表是Hive中的"智能文件分组"技术,它把数据均匀分布到固定数量的文件中,通过哈希算法保证相同值的数据进入同一个文件,专门用于优化JOIN、抽样、大数据量聚合。
木卫二号Coding3 天前
hive
hivesql 字段aa值 如何去掉前面的0在Hive SQL中去除字段值的前导零,可以通过以下两种常用方法实现:说明:说明:如果字段可能包含非数字字符,建议先使用正则表达式处理:
yumgpkpm4 天前
大数据·人工智能·hive·zookeeper·flink·kafka·cloudera
Cloudera CDP 7.3(国产CMP 鲲鹏版)平台与银行五大平台的技术对接方案Cloudera CDP 7.3(国产CMP 鲲鹏版)平台与银行五大平台的技术对接方案一份 CMP(Cloud Data AI Platform)与银行五大核心业务平台 的技术对接方案整理。该方案聚焦于数据层面的集成,适用于银行在构建数据中台、智能风控、客户洞察等场景下,如何通过 CMP 实现统一的数据湖仓、治理、分析与服务化能力。
默 语6 天前
hive·spring boot·后端
Spring Boot 3.x升级踩坑记:到底值不值得升级?最近Spring Boot 3.x发布也有一段时间了,我负责的项目也考虑要不要升级。研究了一下,发现改动还挺大的,Java 17起步、Jakarta EE、GraalVM原生镜像支持等等。今天就把升级过程中踩的坑都记录下来,给要升级的同学参考。