hive词频统计---文件始终上传不来

目录

准备工作:

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

hive里面查询,始终报错:(直接查询也是不行)

解决方案:


准备工作:

xshell连接主机,启动hadoop集群,启动MySQL服务已就绪

文件内容:

创建数据库及表

将文件上传到:上传到/user/hive/warehouse/db1.db/t_word目录下

尝试使用Hive的LOAD DATA语句加载数据到表:

复制代码
LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

hive里面查询,始终报错:(直接查询也是不行)

复制代码
hive> LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;
FAILED: SemanticException Line 1:17 Invalid path ''/user/hive/warehouse/db1.db/t_word/word.txt'': No files matching path hdfs://mini01:8020/user/hive/warehouse/db1.db/t_word/word.txt

解决方案:

先创建目录,再将文件上传到目录下,再去加载到数据库表中,最后再去查询即可;

复制代码
hadoop fs -mkdir -p /user/hive/warehouse/db1.db/t_word




hadoop fs -put word.txt /user/hive/warehouse/db1.db/t_word/



LOAD DATA INPATH '/user/hive/warehouse/db1.db/t_word/word.txt' INTO TABLE t_word;

注意:文件重复要删除

相关推荐
Leo.yuan2 小时前
数据仓库建设全解析!
大数据·数据库·数据仓库·数据分析·spark
Aimyon_362 小时前
Apache Sqoop数据采集问题
hadoop·apache·sqoop
2501_906314329 小时前
优化无头浏览器流量:使用Puppeteer进行高效数据抓取的成本降低策略
开发语言·数据结构·数据仓库
youka15018 小时前
大数据学习栈记——Hive4.0.1安装
大数据·hive·学习
IT成长日记1 天前
【Hive入门】Hive基础操作与SQL语法:DDL操作全面指南
hive·hadoop·sql·ddl操作
IT成长日记1 天前
【Hive入门】Hive分桶表深度解析:从哈希分桶到Join优化的完整指南
hive·hadoop·哈希算法·哈希分桶·join优化
和算法死磕到底1 天前
ubantu18.04(Hadoop3.1.3)之Spark安装和编程实践
大数据·hadoop·pycharm·spark
菜鸟、上路1 天前
Hadoop 集群扩容新增节点操作文档
大数据·hadoop·分布式
IT成长日记1 天前
【Hive入门】Hive动态分区与静态分区:使用场景与性能对比完全指南
数据仓库·hive·hadoop·动态分区·静态分区
嘟嘟嘟嘟嘟嘟嘟.1 天前
spark和hadoop之间的对比和联系
hadoop·spark