【Hadoop之HDFS替换方案】【Haoop远程挂载Cubefs】Cubefs对接Hadoop生态

一、背景

为了解决Hadoop存算一体带来的问题,我对Hadoop的存算分离做了方案尝试,使用Cubefs替换现有的HDFS,相当于Hadoop的存储远程挂载,下面是踩坑记录。

官方参考链接

二、问题和解决

  1. java.lang.UnsatisfiedLinkError: Unable to load library 'libcfs.so':说明你编译的libcfs.so文件没有上传到位,以下是我传的所有位置:

    官网信息不全,一定要按照我的截图路径都传,并且是每个节点

  2. 在运行hive on mapreduce任务时报错org.apache.hadoop.fs.UnsupportedFileSystemException: fs.AbstractFileSystem.cfs.impl=null: No AbstractFileSystem configured for scheme: cfs

    这个代表你的配置文件少了,要注意core-site.xml加了什么,hive-site.xml里也要加上

  3. java.lang.NoSuchFieldError:HADOOP_CLASSPATH

    明显是环境变量问题,环境变量要注意在 /etc/profile下有以下配置:

bash 复制代码
export HADOOP_CLASSPATH=`/opt/module/hadoop-3.1.3/bin/hadoop classpath`
export CFS=/opt/module/hadoop-3.1.3/lib/native
export HADOOP_CLASSPATH=$CFS:$HADOOP_CLASSPATH

另外一定要注意 yarn-site.xml中要加入HADOOP_CLASSPATH:

三、总结

总之目前Cubefs还处于CNCF孵化项目,文档不是很全,需要一定的运维功底。

相关推荐
手可摘星辰7775 小时前
一次线上FlinkCDC异常排查复盘
大数据·flink
大大大大晴天5 小时前
Hudi技术内幕:Metadata Table原理与实践
大数据
大大大大晴天1 天前
Hudi技术内幕:深入解析Index索引机制
大数据
阿里云大数据AI技术1 天前
Flink Forward Asia 2026 深圳启幕:Agentic Streaming for AI,开启实时智能新范式
大数据·flink
SelectDB2 天前
阶跃星辰基于 SelectDB 构建 PB 级 Agent 可观测平台
大数据·数据库·aigc
大大大大晴天5 天前
Hudi技术内幕:RecordPayload到RecordMerger
大数据
SelectDB6 天前
秒级弹性、最高降本 70%:SelectDB Serverless 如何重塑云数仓资源效率
大数据·后端·云原生
WhoAmI6 天前
MapReduce框架原理解析一:InputFormat
大数据·hadoop
WhoAmI6 天前
MapReduce框架原理解析三:OutputFormat
大数据·hadoop
WhoAmI6 天前
MapReduce框架原理解析二:Shuffle
大数据·hadoop