Hadoop简介

1. Hadoop简介

官网:http://hadoop.apache.org

1.1 Hadoop架构
  • Hadoop由三个模块组成:分布式存储HDFS、分布式计算MapReduce、资源调度引擎YARN
1.2 Hadoop历史
  • Hadoop作者Doug Cutting

  • Apache Lucene是一个文本搜索系统库

  • Apache Nutch作为前者的一部分,主要包括web爬虫、全文检索;2003年"谷歌分布式文件系统GFS"论文,2004年开源版本NDFS

  • 2004年"谷歌MapReduce"论文,2005年Nutch开源版MapReduce

2、更多内容:

相关推荐
小程故事多_803 小时前
Kthena 引爆云原生推理革命:K8s 分布式架构破解 LLM 编排困局,吞吐狂飙 273%
人工智能·分布式·云原生·kubernetes·aigc
西岭千秋雪_3 小时前
Kafka服务端日志梳理
java·分布式·zookeeper·kafka
初学者,亦行者4 小时前
【探索实战】从 30 分钟搭建到生产落地,分布式云原生管理新范式
分布式·云原生
jiayong234 小时前
Elasticsearch 完全指南:原理、优势与应用场景
大数据·elasticsearch·搜索引擎
雪兽软件5 小时前
2025 年 15 大大数据技术:从 Hadoop 到 BigQuery 及其他
大数据·大数据技术
TDengine (老段)5 小时前
TDengine 时间函数 WEEK 用户手册
大数据·数据库·物联网·时序数据库·iot·tdengine·涛思数据
还是鼠鼠6 小时前
Redisson实现的分布式锁能解决主从一致性的问题吗?
java·数据库·redis·分布式·缓存·面试·redisson
G***E3166 小时前
区块链在能源中的分布式交易
分布式·区块链·能源
xieyan08116 小时前
选股中的财务指标运用_ROE_PE_PB...
大数据·人工智能
颜子鱼8 小时前
git基础
大数据·git·elasticsearch