技术栈
big data
Yz9876
17 小时前
大数据
·
数据仓库
·
hive
·
hadoop
·
hdfs
·
数据库开发
·
big data
Hive分桶超详细!!!
数据分区可能导致有些分区,数据过多,有些分区,数据极少。分桶是将数据集分解为若干部分(数据文件)的另一种技术。
Data-Miner
2 天前
大数据
·
big data
12万字 | 企业智慧数字化运营平台重构建设项目实施技术方案
本项目旨在推动企业数字化运营平台的重构,以支持组织改革和数字化转型战略的实施,提升企业智慧化运营管理能力。项目将优化订单受理流程,增强业务受理能力,提高客户服务体验和内部管控能力,同时提升营销资源管理的制度化和流程化,完善客户权益管理体系,加强权限管控体系,以适应市场环境的快速发展,确保业务的持续推进。
标贝科技
3 天前
人工智能
·
机器学习
·
语言模型
·
数据挖掘
·
自动驾驶
·
database
·
big data
标贝科技:AI基础数据服务,人工智能行业发展的底层支撑
近年来,随着不同大模型在语言理解及生成等领域的出色表现,大模型别后的规模规律不断强化数据在要提升AI性能上的关键作用,AI数据服务可加速高质量数据的获取与标注,推动AI算法的创新与持续优化,是AI产业发展的基础。加速高质量数据的获取与标注,推动AI算法的创新与持续优化,是未来人工智能行业发展的大势所趋。
Yz9876
4 天前
大数据
·
数据仓库
·
hive
·
hadoop
·
数据库开发
·
big data
hive-内部表&外部表-详细介绍
内部表:表面来看,我们建的所有的表,默认都是内部表,内部表又叫做管理表,它的位置也很固定/user/hive/warehouse下面。
流浪在地球上的小朋友
6 天前
大数据
·
搜索引擎
·
云计算
·
全文检索
·
big data
移门缓冲支架:减少噪音,提升生活质量
移门缓冲支架不仅是一个简单的五金配件,更是提升家居生活质量的有效工具。通过减少门关闭时的噪音,移门缓冲支架能够创造一个安静、舒适的生活环境。以下是移门缓冲支架在减少噪音、提升生活质量方面的详细解析:
Data-Miner
7 天前
大数据
·
big data
大数据湖项目建设方案(100页WORD)
随着信息技术的飞速发展,数据量呈现出爆炸性增长的趋势。企业、政府机构及科研单位在运营过程中积累了大量的数据资源,这些数据中蕴含着巨大的价值,但如何高效地存储、处理和分析这些数据,成为了一个亟待解决的问题。大数据湖作为一种集中式的数据存储和处理平台,能够实现对海量数据的统一存储、灵活访问和高效分析,对于提升数据价值挖掘能力、促进业务创新和决策智能化具有重要意义。因此,本方案旨在建设一个高效、安全、可扩展的大数据湖项目,以满足日益增长的数据处理需求。
Yz9876
8 天前
大数据
·
分布式
·
zookeeper
·
kafka
·
big data
Kafka面试题
在消息发送时涉及到了两个线程,main 线程 和 sender 线程 ,在main线程里面创建了一个双端队列(RecordAccumulator) ,当双端队列里面的信息满足 一定的条件后, sender线程会拉取双端队列里面的信息,sender线程会不断的拉取信息发送给Kafka集群。
zmd-zk
9 天前
大数据
·
数据仓库
·
hive
·
hadoop
·
windows
·
分布式
·
big data
hive中windows子句的使用
1,windows子句是对窗口的结果做更细粒度的划分2、windows子句中有两种方式rows :按照相邻的几行进行开窗
Yz9876
10 天前
大数据
·
linux
·
数据仓库
·
hive
·
hadoop
·
分布式
·
big data
Hive的远程模式
hive.downloaded.resources.dir:在 hdfs 上下载的一些资源会被存放在这个目录下,hive 一定要小写,否则报:
Yz9876
12 天前
java
·
大数据
·
hive
·
hadoop
·
hdfs
·
zookeeper
·
big data
Hadoop集群的高可用(HA)- (1、搭建namenode的高可用)
HA: High Availability,高可用集群,指的是集群7*24小时不间断服务Hadoop中存在单点故障问题:NameNode ResourceManager
Yz9876
18 天前
大数据
·
hadoop
·
mapreduce
·
big data
Hadoop-MapReduce任务三种运行开发模式
数据在本地,代码也在本地,使用本机的电脑的资源运行我们的MR输入和输出路径指的都是本地路径,运行时耗费的资源也是本地资源。
JasonKQLin
20 天前
big data
gzip不同压缩等级的区别
Gzip supports different compression levels, which range from 1 (fastest, least compression) to 9 (slowest, most compression). Here’s what each level generally means:
jerry609
21 天前
big data
lab1测试脚本注解
lab1的两个测试bash的解释以下是这个脚本的逐行备注:
Data-Miner
22 天前
大数据
·
big data
54页可编辑PPT | 大型集团企业数据治理解决方案
这份PPT是关于大型集团企业数据治理的全面解决方案,它详细介绍了数据治理的背景、需求、管理范围、框架、解决思路,以及数据治理在实际操作中的关键步骤。内容涵盖了数据架构、数据质量、数据应用等方面的问题,并提出了数据资产透视、智能搜索发现、主数据管理等策略来优化数据管理。
雪中鱼01
1 个月前
大数据
·
elasticsearch
·
搜索引擎
·
全文检索
·
big data
Elasticsearch如何搜索日志并存储
Elasticsearch 是一个分布式搜索引擎,擅长对大量数据进行实时的搜索、分析和存储。它常被用于处理日志数据,配合工具如 Logstash 或 Filebeat 来收集和存储日志,并提供强大的搜索和分析能力。接下来,我将解释 Elasticsearch 如何处理日志的存储和搜索功能。
雷神乐乐
1 个月前
大数据
·
linux
·
分布式
·
kafka
·
big data
Kafka相关API开发
用API直接去操作kafka(读写数据)在实际开发中用的并不多,学习它主要还是为了加深对Kafka功能的理解。kafka的读写操作,实际开发中,是通过各类更上层的组件去实现。而这些组件在读写kafka数据时,用的当然是kafka的java api,比如flink、spark streaming和flume等。
云表平台
1 个月前
big data
不装了,摊牌了,微软始料未及,WPS用户:我们已经在使用了
微软把ChatGPT融入了Power Platform无代码开发平台上,这意味着你就算编程知识有限,或者完全是个门外汉,也能轻松创造出自己的应用程序
跳舞的皮埃尔
1 个月前
爬虫
·
python
·
决策树
·
big data
6、基于Python+爬虫+LDA+决策树的《富士山下》评论数据情感分析【开题+源程序+论文】
在当今信息化社会中,在线社交平台和音乐平台已成为用户情感表达和观点交流的重要途径。网易云音乐作为中国领先的音乐平台之一,吸引了大量用户通过评论区表达对音乐作品的情感反馈。用户的评论不仅反映了他们对歌曲的态度和感受,也揭示了更广泛的社会情绪。《富士山下》作为粤语经典歌曲之一,在网易云音乐平台上拥有数以万计的评论,这些评论为情感分析提供了丰富的语料。 通过分析这些评论数据,研究者能够洞察歌曲引发的情感共鸣,探索用户的情感倾向,并揭示不同群体的情感差异。情感分析作为自然语言处理领域的重要方向,已经在产品评价、社
:mnong
1 个月前
人工智能
·
python
·
深度学习
·
tensorflow
·
big data
跟着深度学习好书实践tensorflow神经网络
2024 年诺贝尔物理学奖授予了约翰·霍普菲尔德 (John Hopfield)和图灵奖得主、AI教父杰弗里·辛顿(Geoffrey Hinton),"以表彰他们利用人工神经网络进行机器学习的奠基性发现和发明"。
微软技术栈
2 个月前
microsoft
·
big data
·
azure
Azure Data Box 80 TB 现已在中国区正式发布
我们非常高兴地宣布,Azure Data Box 80 TB SKU现已在 Azure 中国区正式发布。Azure Data Box 是 Azure 的离线数据传输解决方案,允许您以快速、经济且可靠的方式将 PB 级数据从 Azure 存储中导入或导出。通过硬件传输设备可加速数据的安全传输,实现向 Azure 的脱机无缝数据导入。中国市场的客户现在可以订购硬件设备,在任何 Azure 中国区内进行数据的导入或导出。