技术栈
mapreduce
木子ee
6 天前
大数据
·
语言模型
·
mapreduce
LLM×MapReduce: Simplified Long-Sequence Processing using Large Language Models
LLM×MapReduce: Simplified Long-Sequence Processing using Large Language Models
迈巴赫车主
12 天前
大数据
·
hadoop
·
mapreduce
大数据:Hadoop(MapReduce)
MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。
菜鸡儿齐
19 天前
大数据
·
学习
·
mapreduce
MapReduce-源码学习
map阶段流程 reduce阶段流程Driver代码map代码:reduce代码:combiner代码:
英英_
20 天前
开发语言
·
matlab
·
mapreduce
优化 MATLAB MapReduce 程序性能:从基础调优到进阶提速
MapReduce 的性能瓶颈常出现在数据读取和数据预处理阶段(占比可达 60% 以上),优先优化这部分能快速见效。
英英_
20 天前
开发语言
·
matlab
·
mapreduce
MATLAB MapReduce 从入门到实战:大数据处理完整教程
MapReduce 是处理大规模数据集的经典分布式计算框架,MATLAB 内置的 MapReduce 功能可直接对接本地文件、HDFS 等数据源,无需额外搭建复杂集群,是科研和工程领域处理大数据的高效工具。本文从基础概念、核心流程到实战案例,全方位讲解 MATLAB MapReduce 的使用方法,帮助零基础用户快速掌握这一技术。
王的宝库
1 个月前
hive
·
hadoop
·
sql
·
mapreduce
MapReduce / Hive / Pig :从底层批处理到 SQL/脚本落地
最近整理大数据离线计算这块内容时,我最大的感受是:MapReduce 是底层发动机,而 Hive / Pig 是“让我们少写 Java”的上层工具。理解它们的定位和边界,做实验和写作业会顺很多,也能少踩坑。
之歆
2 个月前
大数据
·
hadoop
·
mapreduce
Hadoop MapReduce 详解
想象一个巨大的文档分类任务,一个人处理要一个月。MapReduce 把这个任务分配给一百个人,每人处理一小部分,最后把结果汇总,半小时就完成了!这就是 MapReduce 的威力!
UhMITKJvJkro
2 个月前
mapreduce
51单片机LCD1602数字电压表(二):搭建与探索
51单片机LCD1602数字电压表(二) C程序、proteus仿真、报告、仿真操作视频 支持LCD1602显示被测电压 量程:0-5V
大数据基础
2 个月前
大数据
·
vue.js
·
hadoop
·
spring boot
·
数据分析
·
maven
·
mapreduce
基于 Hadoop MapReduce + Spring Boot + Vue 3 的每日饮水数据分析平台
本文详细介绍一个完整的大数据分析项目,从数据采集、MapReduce 分析处理到前端可视化展示的全流程实现。项目采用 Hadoop MapReduce 进行大数据分析,Spring Boot 提供 RESTful API,Vue 3 + ECharts 实现数据可视化。
what丶k
2 个月前
大数据
·
mapreduce
MapReduce 详解:分布式计算的开山鼻祖与核心实践
在大数据浪潮席卷全球的今天,当我们面对 PB 级、EB 级的海量数据时,传统单机计算早已力不从心——无论是服务器的算力上限,还是数据存储的容量瓶颈,都让大规模数据处理成为一道难题。而 MapReduce,作为分布式计算领域的“开山鼻祖”,以其“分而治之”的核心思想,为海量数据处理提供了一套高效、可靠、可扩展的解决方案,更是奠定了 Hadoop 生态的核心基石。
十月南城
2 个月前
hadoop
·
hdfs
·
mapreduce
Hadoop基础认知——HDFS、YARN、MapReduce在现代体系中的位置与价值
写在前面,本人目前处于求职中,如有合适内推岗位,请加:lpshiyue 感谢。HDFS 是海量数据的基座,MapReduce 是批量计算的引擎,而 YARN 是集群资源的调度者——它们共同构成了大数据处理的“古典三位一体”。
迎仔
2 个月前
大数据
·
apache
·
mapreduce
03-Apache Tez 通俗指南:MapReduce 的“高速公路”升级包
在 Hadoop 的早期,MapReduce 是绝对的主角,但它有一个被吐槽最多的问题:太慢了。 虽然 Spark 后来出来了,但 Hadoop 社区为了拯救既有资产(大量的 Hive SQL 任务),推出了 Tez。
bigdata-rookie
2 个月前
大数据
·
spark
·
mapreduce
Spark shuffle 和 MapReduce shuffle 的区别
shuffle 的字面意思是洗牌、混洗的意思,就是把一组有规律的数据尽量打乱成无规律的数据。但在 MapReduce 中 Shuffle 更像是洗牌的逆过程,其将 Map 端输出的混乱数据按指定规则划分成有一定规律的数据,以方便 Reduce 端接收处理。MapReduce 的工作阶段主要可有分为 Map 端和 Reduce 端两个部分。
ha_lydms
2 个月前
大数据
·
hadoop
·
hdfs
·
架构
·
mapreduce
·
yarn
·
数据处理
Hadoop 架构
高可靠性:Hadoop底层维护多个数据副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失。
shjita
2 个月前
大数据
·
mapreduce
mapreduce多文件的处理手法
1、多输入文本。多个fileinputform,路径参数可用多个args[0],args[1]...2、运行时数据文件存放在hdfs中。
徐先生 @_@|||
3 个月前
大数据
·
hadoop
·
云原生
·
spark
·
mapreduce
大数据技术栈演进:从MapReduce到云原生计算的全面对比(2026年)
大数据处理技术在过去二十年经历了显著的范式演进,发展轨迹清晰地反映了行业对实时性、资源效率、开发运维一体化的持续追求:
talle2021
3 个月前
大数据
·
hadoop
·
mapreduce
Hadoop分布式计算框架【MapReduce】
目录1.MapReduce概述1.1 基本概念1.2 特点1.3 适用场景2.MapReduce原理2.1 基本概念
無森~
3 个月前
大数据
·
hadoop
·
mapreduce
实战:温度分析
本文将通过一个案例来了解Hadoop中Partitioner,SortComparator,GroupingComparator。
無森~
3 个月前
大数据
·
mapreduce
MapReduce
MapReduce是一个分布式运算程序的框架重要组成部分,是用户开发“基于Hadoop HDFS的数据分析应用”的核心框架。