Hadoop简介

1. Hadoop简介

官网:http://hadoop.apache.org

1.1 Hadoop架构
  • Hadoop由三个模块组成:分布式存储HDFS、分布式计算MapReduce、资源调度引擎YARN
1.2 Hadoop历史
  • Hadoop作者Doug Cutting

  • Apache Lucene是一个文本搜索系统库

  • Apache Nutch作为前者的一部分,主要包括web爬虫、全文检索;2003年"谷歌分布式文件系统GFS"论文,2004年开源版本NDFS

  • 2004年"谷歌MapReduce"论文,2005年Nutch开源版MapReduce

2、更多内容:

相关推荐
KmSH8umpK15 小时前
Redis分布式锁从原生手写到Redisson高阶落地,附线上死锁复盘优化方案进阶第七篇
数据库·redis·分布式
_F_y20 小时前
仿RabbitMQ实现消息队列-服务端核心模块实现(4)
分布式·rabbitmq
lizhihai_9920 小时前
股市学习心得—半导体12种核心材料
大数据·人工智能·学习
ZGi.ai20 小时前
智能客服系统设计:从工单分类到自动派单的工程实现
大数据·人工智能·分类
PaperData21 小时前
2000-2023年地级市数字基础设施评价指标体系
大数据·网络·数据库·人工智能·数据分析·经管
Blockchain Learning21 小时前
去中心化身份(DID)模型解析:区块链如何重塑身份管理?
大数据·去中心化·区块链
xcbrand1 天前
政府事业机构品牌策划公司哪家可靠
大数据·人工智能·python
程序鉴定师1 天前
如何选择合适的深圳小程序开发公司?
大数据·小程序
晨启AI1 天前
GPT-5.5 来了!OpenAI 最新提示词指南深度解读
大数据·人工智能·ai·提示词
地球资源数据云1 天前
中国陆地生态系统主要植物功能特征空间分布数据
大数据·数据库·人工智能·机器学习