三面技术(运维)

1、说下hdfs读写流程

2、hdfs写的流程中block 大小为何是128m

A:block大小设置原则:最小化寻址开销,减少网络传输.

3、为什么HDFS中块(block)不能设置太大,也不能设置太小?

4、HDFS中块(block)的大小为什么设置为128M?

hdfs中存储以块的形式存储在DataNode,block块大小可以通过

HADOOP_HOME/etc/hadoop/hdfs-site.xml中dfs.blocksize实现(设置时先stop集群,修改完restart集群)。在Hadoop2.x之后的版本中,文件块的默认大小是128M,老版本中默认是64M;

5、你懂spark嘛?说下spark执行流程

6、doris和clickhouse比较

clickhouse做数据分析的数据库,拓展性不如doris。doris可以通过增加

OLAP数据库选型指南:Doris与ClickHouse的深入对比与分析-腾讯云开发者社区-腾讯云

7.数据迁移怎么做的?(数据迁移的步骤,纯听他人口述)

1、mysql中建有orcle对应的表,mysql有些数据类型不一样,比如:vachar,把orclr存

0、先备份orcle数据库

1、建好对应的表字段

2、

3、迁移过来,要确保数据一致性和完整性 查:count(*)orcle 一般多少多少条 (测试数据用的200多万条,每天大概增量数据 10个 200-300万条 和全量数据有一千万)

4、看是否会漏字段,看新建字段是否 一张表:自己看字段是否相同

5、在orcle和mysql

需求分析:

评估数据量

数据库orcle数据库备份

建好对应表

看orcle对应的数据类型和mysql有什么不一样,和orcle不一样的对应存储

写sqoop配置(写sqoop配置)--检测:全量的数据是否同步--先检查临时表

相关推荐
舒一笑1 天前
程序员效率神器:一文掌握 tmux(服务器开发必备工具)
运维·后端·程序员
NineData2 天前
数据库管理工具NineData,一年进化成为数万+开发者的首选数据库工具?
运维·数据结构·数据库
梦想很大很大2 天前
拒绝“盲猜式”调优:在 Go Gin 项目中落地 OpenTelemetry 链路追踪
运维·后端·go
Sinclair2 天前
内网服务器离线安装 Nginx+PHP+MySQL 的方法
运维
叶落阁主2 天前
Tailscale 完全指南:从入门到私有 DERP 部署
运维·安全·远程工作
甲鱼9294 天前
MySQL 实战手记:日志管理与主从复制搭建全指南
运维
碳基沙盒6 天前
OpenClaw 多 Agent 配置实战指南
运维
蝎子莱莱爱打怪9 天前
Centos7中一键安装K8s集群以及Rancher安装记录
运维·后端·kubernetes
DianSan_ERP9 天前
电商API接口全链路监控:构建坚不可摧的线上运维防线
大数据·运维·网络·人工智能·git·servlet
呉師傅9 天前
火狐浏览器报错配置文件缺失如何解决#操作技巧#
运维·网络·windows·电脑