hive词频统计---文件始终上传不来

目录

准备工作:

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

hive里面查询,始终报错:(直接查询也是不行)

解决方案:


准备工作:

xshell连接主机,启动hadoop集群,启动MySQL服务已就绪

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

尝试使用Hive的LOAD DATA语句加载数据到表:

复制代码
LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

hive里面查询,始终报错:(直接查询也是不行)

复制代码
hive> LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;
FAILED: SemanticException Line 1:17 Invalid path ''/user/hive/warehouse/db1.db/t_word/word.txt'': No files matching path hdfs://mini01:8020/user/hive/warehouse/db1.db/t_word/word.txt

解决方案:

先创建目录,再将文件上传到目录下,再去加载到数据库表中,最后再去查询即可;

复制代码
hadoop fs -mkdir -p /user/hive/warehouse/db1.db/t_word




hadoop fs -put word.txt /user/hive/warehouse/db1.db/t_word/



LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

注意:文件重复要删除

相关推荐
IIIIIILLLLLLLLLLLLL8 小时前
Hadoop集群时间同步方法
大数据·hadoop·分布式
RestCloud16 小时前
神州通用数据库的 ETL 集成方案:兼容性与性能实战
数据库·数据仓库·etl·数据处理·数据集成·数据传输·神州通用
Macbethad17 小时前
WPF工业设备诊断管理程序技术方案
大数据·hadoop·分布式
稚辉君.MCA_P8_Java18 小时前
Gemini永久会员 Hadoop分布式计算框架MapReduce
大数据·hadoop·分布式·架构·mapreduce
士心凡18 小时前
数据仓库教程
大数据·数据仓库·spark
士心凡20 小时前
hadoop
大数据·hadoop·分布式
IIIIIILLLLLLLLLLLLL20 小时前
Hadoop完全分布式安装
大数据·hadoop·分布式
一颗宁檬不酸20 小时前
《Java Web 期末项目分享:MVC+DBUtils+c3p0 玩转数据库增删改查》——第一弹
数据仓库·hive·hadoop
丸码20 小时前
Servlet生命周期全解析
数据仓库·hive·hadoop
士心凡20 小时前
Hive教程
数据仓库·hive·hadoop