数据仓库

归去来?2 小时前
大数据·数据仓库·hive·python·网络协议·5g·https
记录一次从https接口提取25G大文件csv并落表的经历某日下班后,领导临时分配了一个任务,有一个https接口提供的csv格式数据,量级比较大,需要提取并落表,解析成结构化的数据,用于做一些数据分析。 业务方提供了几天的接口文件url,格式如下:https://*****file.csv,直接点击即进入浏览器下载状态,一个文件量级达二十多G,预计需要两个小时下载完成; 同时,业务方也提供了一些清洗及指标统计规则,但未提供数据原始字段格式。
zgl_200537799 小时前
大数据·数据库·数据仓库·hadoop·数据治理·sql解析·数据血缘
源代码:ZGLanguage 解析SQL数据血缘 之 显示 UPDATE SQL 结构图# SQL代码如下所示 :# 通过 ZGLanguage + Python 将以上SQL转换成 Echarts 的树结构数据:
QQ12958455042 天前
数据仓库·数据分析
SSAS - 步骤一:通过VS2022新建项目本文介绍如何通过Visual Studio 2022创建SSAS项目。
無森~4 天前
数据仓库·hive·hadoop
Hive概述对比项Hive关系型数据库查询语句HQLSQL数据存储HDFSLocal FS or RawDevice
無森~4 天前
数据仓库·hive·hadoop
Hive下载与安装Hive中metastore (元数据存储)的三种模式:a)内嵌Derby模式b)直连数据库模式c)远程服务器模式
無森~4 天前
数据仓库·hive·hadoop
Hive输出表信息中文乱码解决方案输出表信息的时候,如果含有中文可能会出现乱码。检查hive_remote数据库创建,使用的utf8:检查表COLUMNS_V2的创建语句,发现表和COMMENT使用的latin1编码格式,所以出现中文乱码:
王九思5 天前
数据仓库·hive·hadoop
Hive Hook 机制Hive Hook 是 Apache Hive 提供的一种扩展机制,允许开发者在 Hive 执行的特定阶段插入自定义逻辑。通过 Hook,可以在查询解析、优化、执行等关键节点进行拦截和干预,实现审计、监控、安全控制等功能。
走遍西兰花.jpg6 天前
数据仓库·hive·hadoop·python
hive如何使用python脚本举个栗子我们要用python脚本实现对hive的用户表解析出他的性别
沃达德软件6 天前
大数据·数据仓库·人工智能·科技·数据库架构
智慧监管新形态:科技赋能智慧监管是基于物联网、大数据、人工智能、移动互联网等技术形成的未来监所信息化新形态,规划、管理监所,配置、调度监所人力、设备、信息等所有资源。智慧监管对监管场所对象的活动情况、警力分布、物力资源、场所警戒、所政管理等要素进行全面感知,实现监管中心更科学、规范、高效地履行执行职能。智慧监管中心的应用模块,包括可视化指挥、人员定位、重点管控、大数据安全预警、就医安全管控、监所执法管理、应急处理、监所服务、自动提审会见等功能。 #智慧警务#数据建模#大数据平台#大数据分析#大数据
青云交6 天前
java·数据仓库·spark·分层设计·java+spark·离线数据仓库·etl 开发
Java 大视界 -- Java+Spark 构建离线数据仓库:分层设计与 ETL 开发实战(445)嘿,亲爱的 Java 和 大数据爱好者们,大家好!我是CSDN(全区域)四榜榜首青云交!10 余年 Java 大数据与数据仓库实战经验,主导过金融、电商、零售等赛道超 40 个离线数据仓库项目。这些年见过太多团队在数据仓库建设上走弯路:有电商平台因分层设计混乱,导致报表查询效率低下,单次取数耗时超 1 小时;有金融机构因 ETL 脚本缺乏容错机制,数据丢失导致监管合规风险;还有初创公司盲目跟风 “大数据架构”,搭建的仓库冗余复杂,维护成本远超业务价值。
zgl_200537796 天前
大数据·数据库·数据仓库·sql·数据治理·etl·数据血缘
源代码:ZGLanguage 解析SQL数据血缘 之 显示 WITH SQL 结构图# SQL代码如下所示 :# 通过 ZGLanguage + Python 将以上SQL转换成 Echarts 的树结构数据:
m0_748252386 天前
数据仓库·hive·hadoop
ervlet 编写过滤器Servlet 过滤器可以动态地拦截请求和响应,以变换或使用包含在请求或响应中的信息。可以将一个或多个 Servlet 过滤器附加到一个 Servlet 或一组 Servlet。Servlet 过滤器也可以附加到 JavaServer Pages (JSP) 文件和 HTML 页面。调用 Servlet 前调用所有附加的 Servlet 过滤器。
xiaomici7 天前
数据仓库
SAC Planning 高级计算公式-2如果你不做其他的限定,下面的这个公式就是计算A产品的revenue,用Price*Quantity。但是你这里都没管时间。
沃达德软件7 天前
大数据·数据仓库·数据库开发·数据库架构·etl工程师
智慧政工中心功能解析智慧政工中心,满足人事管理需求,提供标准的警力资源和组织机构信息库。基于海量警力资源数据的深度挖掘应用,推进人岗匹配、推荐系统、优化班子配备和干部考评、考核功能。智慧政工中心包括两大模块,一是基础信息管理,包括人员基础信息、岗位管理和组织机构资源信息库;二是基础应用,包括政工日常工作流、各部门人事相关工作应用和专业管理。智慧政工功能,包括警力资源管理、基础信息管理、警力资源数据挖掘、考评考核管理、综合管理、表彰奖励等。 #智慧警务#大数据#大数据分析#大数据平台#数据建模
温暖小土7 天前
数据库·数据仓库·clickhouse·apache
ClickHouse vs Apache Doris:2026年实时OLAP数据库选型深度解析在当今数据驱动的时代,实时在线分析处理(OLAP)数据库已成为企业从海量数据中快速获取洞察力的关键。ClickHouse 和 Apache Doris 作为两大主流的开源 OLAP 数据库,凭借其卓越的查询性能和强大的数据处理能力,在业界广受关注。然而,面对复杂的业务场景和不断演进的技术需求,如何在这两者之间做出明智的选择,成为了许多技术团队面临的挑战。本文旨在深入剖析 ClickHouse 和 Apache Doris 在 2026 年的最新技术特性、架构设计、性能表现、运维复杂度及适用场景,为读者提供
沃达德软件7 天前
大数据·数据仓库·数据库开发
警务指挥情报中心建设警务指挥情报中心,将云计算、大数据、人工智能等先进技术应用于警务实战,驱动警务新型情报一体化机制的建设,依靠大数据打造具有智慧的警务大脑和触角灵敏、延伸广阔的神经中枢,使情报和指挥工作联动响应、一体化作战,实现服务实战、精确打击。警务指挥情报中心的功能,包括辖区人口监控、重点场所监控、视频监控、警情预警、预案部署可视、应用资源管理可视、警情监控、指挥调度支持、智能卡口分析、车辆稽查监控、情报分析。 #智慧警务#大数据#数据建模#大数据分析#大数据平台
zgl_200537797 天前
大数据·数据库·数据仓库·sql·数据治理·sql解析·数据血缘
源代码:ZGLanguage 解析SQL数据血缘 之 显示 UNION SQL 结构图# SQL代码如下所示 :# 通过 ZGLanguage + Python 将以上SQL转换成 Echarts 的树结构数据:
CoookeCola8 天前
数据仓库·人工智能·目标检测·计算机视觉·数据挖掘
从人脸检测到音频偏移:基于SyncNet的音视频偏移计算与人脸轨迹追踪技术解析项目聚焦于音频 - 视频同步(检测音视频时间偏移、判定多人脸视频中的说话人),代码中音视频特征提取、偏移计算、多人脸追踪 / 裁剪等逻辑均与该仓库一致;
zgl_200537799 天前
大数据·数据库·数据仓库·hadoop·sql·代码规范·源代码管理
ZGLanguage 解析SQL数据血缘 之 Python + Echarts 显示SQL结构图### 根据之前文章的说明,可以使用 Python 对 ZGLanguage 的SQL代码解析结果进行处理,得到SQL的表级血缘树信息:
SelectDB技术团队9 天前
数据库·数据仓库·人工智能·sql·apache
驾驭 CPU 与编译器:Apache Doris 实现极致性能的底层逻辑过去 10 年,数据分析基准的成绩已经提升了数十倍。这种性能的提升造就了商业世界中更大的可能 —— 从特定维度的 MOLAP 分析和周期报表,到随时随地从任意维度分析中发掘新范式的 Ad-hoc 查询,直到现在基于 Agent 派生出的复杂查询、高并发 + 高性能需求。基于日益实时、智能的 OLAP 引擎,企业的数据资产正在产生更大的价值。