hadoop

毕设源码-赖学姐29 分钟前
大数据·hadoop·分布式·1024程序员节
【开题答辩全过程】以基于Hadoop的电商数据分析系统为例,包含答辩的问题和答案个人简介一名14年经验的资深毕设内行人,语言擅长Java、php、微信小程序、Python、Golang、安卓Android等
阿什么名字不会重复呢19 小时前
大数据·hadoop·分布式
Hadoop报错 Couldn‘t find datanode to read file from. Forbidden“Couldn’t find datanode to read file from. Forbidden”
通往曙光的路上1 天前
数据仓库·hive·hadoop
day17_cookie_webstorage浏览器中需要有存储数据的技术 从而释放服务端的存储压力1 存在浏览器中2 按域(domian 域名) 存储
B站_计算机毕业设计之家3 天前
大数据·hadoop·python·金融·spark·股票·推荐算法
python股票交易数据管理系统 金融数据 分析可视化 Django框架 爬虫技术 大数据技术 Hadoop spark(源码)✅博主介绍:✌全网粉丝10W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
随心............3 天前
hive·hadoop·sqoop
sqoop采集完成后导致hdfs数据与Oracle数据量不符的问题。怎么解决?sqoop以文本格式导入数据时,默认的换行符是特殊字符当oracle中的数据列中出现了\n、\r、\t等特殊符号,就会被划分为多行
Aurora_eye4 天前
大数据·hadoop·分布式
记录之Ubuntu22.4虚拟机及hadoop为分布式安装参考教程:【图说】VMware & Ubuntu22.04 详细安装教程 Vmware:17.5 Ubuntu:22.04
随心............5 天前
hive·hadoop·spark
在开发过程中遇到问题如何解决,以及两个经典问题问题:思路现象:异常python:error:错误信息java:throw exception:错误信息
yumgpkpm5 天前
数据库·数据仓库·hive·hadoop·flink·mapreduce·big data
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行 hive 查询策略CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境 查询2100w行hive查询策略
K_i1346 天前
运维·hadoop·自动化
Hadoop 集群自动化运维实战2025 年 6-8 月,我参与了某企业生产环境大数据平台搭建项目,核心目标是部署 150 节点的 Hadoop 集群,支撑用户行为分析、数据报表生成等业务。项目初期面临三大痛点:
Q26433650236 天前
大数据·hadoop·python·机器学习·数据分析·spark·毕业设计
【有源码】基于Python与Spark的火锅店数据可视化分析系统-基于机器学习的火锅店综合竞争力评估与可视化分析-基于用户画像聚类的火锅店市场细分与可视化研究注意:该项目只展示部分功能,如需了解,文末咨询即可。发语言:python 采用技术:Spark、Hadoop、Django、Vue、Echarts等技术框架 数据库:MySQL 开发环境:PyCharm
顧棟7 天前
hadoop·yarn
【Yarn实战】Yarn 2.9.1滚动升级到3.4.1调研与实践验证安装本软件,涉及的软件包为:jdk1.8.0_161.tgzzookeeper-3.4.6.tar.gz
D明明就是我7 天前
数据仓库·hive·hadoop
Hive 拉链表在实现数据仓库数据同步的过程中,我们必须保证Hive中的数据与MySQL中的数据是一致的,这样才能确保我们最终分析出来的结果是准确的,没有问题的,但是在实现同步的过程中,这里会面临一个问题:如果MySQL中的数据发生了修改,Hive中如何存储被修改的数据? 例如以下情况 2021-01-01:MySQL中有10条用户信息 2021-01-02:Hive进行数据分析,将MySQL中的数据同步 2021-01-02:MySQL中新增2条用户注册数据,并且有1条用户数据发生更新 2021-01-03:Hive需
嘉禾望岗5037 天前
数据仓库·hive·hadoop
hive join优化和数据倾斜处理使用Hive Join语句时,如果数据量大,可能造成SQL执行速度和查询速度慢,可以进行join优化,Join优化可分为Map Join、Bucket Map Join、Sort Merge Bucket MapJoin、Join 顺序优化。
yumgpkpm7 天前
大数据·hive·hadoop·elasticsearch·zookeeper·big data·cloudera
华为鲲鹏 Aarch64 环境下多 Oracle 数据库汇聚操作指南 CMP(类 Cloudera CDP 7.3)CMP(类 Cloudera CDP 7.3)在华为鲲鹏 Aarch64(ARM)信创环境下,汇聚多个 Oracle 数据库 的操作指南
忧郁火龙果7 天前
数据仓库·hive·hadoop
六、Hive的基本使用
忧郁火龙果7 天前
数据仓库·hive·hadoop
五、安装配置hivemysq启动成功查看密码修改密码后重新登录vim core-site.xml添加以下内容步骤一:切换到root用户
chad__chang8 天前
hive·hadoop
dolphinscheduler安装过程今天分享的是dolphinscheduler2.0.5的安装此文是有root权限的安装 如需无root权限安装请点击:无root安装
ajax_beijing8 天前
大数据·hadoop·分布式
hadoop的三副本数据冗余策略Hadoop分布式文件系统(HDFS)采用三副本机制作为默认数据冗余策略,其核心设计通过跨节点、跨机架的副本分布实现高可靠性与容错能力‌。以下是关键实现细节:
yumgpkpm9 天前
大数据·hive·hadoop·zookeeper·big data·cloudera
CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境多个mysql数据库汇聚的操作指南CMP (类ClouderaCDP7.3(404次编译) )华为鲲鹏Aarch64(ARM)信创环境多个mysql数据库汇聚的操作指南
华阙之梦9 天前
hadoop·windows·apache
【在 Windows 上运行 Apache Hadoop 或 Spark/GeoTrellis 涉及 HDFS 】在 Windows 上运行 Apache Hadoop 或 Spark/GeoTrellis 涉及 HDFS 或文件系统操作时的经典问题 您遇到的错误是 在 Windows 上运行 Apache Hadoop 或 Spark/GeoTrellis 涉及 HDFS 或文件系统操作时的经典问题。