大数据第六天

这里写目录标题

问题

FAILED: ParseException line 1:16 mismatched input 'input' expecting INPATH near 'local' in load statement

MismatchedTokenException(24!=155)

加载数据的时候出现了这个错误,我们解释一个这个错误是什么,具体说的是语法有问题,需要我们修改语法问题

失败:ParseException行1:16输入"input"不匹配,在load语句中应为靠近"local"的INPATH

MismatchedTokenException(24!=155)

这个翻译的原文

我导入的文件

这个才是正确的数据格式

解决问题

发现解决不了

这里写的就是有问题

错误的写法是 Input

正确的是 inpath

总是出现这个错误,我不知道怎么了

我就是在这个服务器上面还是还是没有成功

使用这个方式突然成功了

数据也没有问题

创建数据集表

数据

上传

结果

查询插入(时间慢)

INSERT INTO table student04 select id,name from student01 ;

这个时间大概有一个1分钟了把

练习sql

选择库

shell 复制代码
use test;

创建数据表的方式

shell 复制代码
CREATE table student04(
id int,
namet string
)
row format delimited
fields terminated by ',';

数据格式

加载本地数据库

shell 复制代码
load data local input '/root/hivedata/student.txt' into table student;

数据清理

有一些数据为空我们不需要如何进行处理的方式

我们只想要获取时间数据的方式

经纬度是一个数据如何分成俩个数据的方式

清理为空的数据

LENGTH(sender_gps) = 0

shell 复制代码
SELECT msg_time,sender_name,sender_gps from 
tb_msg_source 
WHERE  LENGTH(sender_gps) = 0
limit 10

获取时间段的数据

SUBSTR(msg_time,12,16)

shell 复制代码
select SUBSTR(msg_time,12,16) from tb_msg_source limit 10; 

分割数据的方式

split(sender_gps,",")[1]

shell 复制代码
SELECT split(sender_gps,",")[1] from tb_msg_source 
相关推荐
数据猿2 小时前
【金猿CIO展】如康集团CIO 赵鋆洲:数智重塑“顶牛”——如康集团如何用大数据烹饪万亿肉食产业的未来
大数据
zxsz_com_cn4 小时前
设备预测性维护的意义 工业设备预测性维护是什么
大数据
samLi06204 小时前
【数据集】中国杰出青年名单数据集(1994-2024年)
大数据
成长之路5145 小时前
【数据集】分地市旅游收入数据集(2000-2024年)
大数据·旅游
大厂技术总监下海5 小时前
用户行为分析怎么做?ClickHouse + 嵌套数据结构,轻松处理复杂事件
大数据·数据结构·数据库
大厂技术总监下海5 小时前
大数据生态的“主动脉”:RocketMQ 如何无缝桥接 Flink、Spark 与业务系统?
大数据·开源·rocketmq
2501_933670796 小时前
2026年中专大数据专业可考取的证书
大数据
oMcLin6 小时前
如何在Ubuntu 22.04 LTS上优化PostgreSQL 14集群,提升大数据查询的响应速度与稳定性?
大数据·ubuntu·postgresql
信创天地6 小时前
核心系统去 “O” 攻坚:信创数据库迁移的双轨运行与数据一致性保障方案
java·大数据·数据库·金融·架构·政务
zhyf1196 小时前
Max395(ubuntu24.04)AMD显卡GLM-4.7-UD-IQ1-M量化模型部署手册
大数据·elasticsearch·搜索引擎