大数据第六天

这里写目录标题

问题

FAILED: ParseException line 1:16 mismatched input 'input' expecting INPATH near 'local' in load statement

MismatchedTokenException(24!=155)

加载数据的时候出现了这个错误,我们解释一个这个错误是什么,具体说的是语法有问题,需要我们修改语法问题

失败:ParseException行1:16输入"input"不匹配,在load语句中应为靠近"local"的INPATH

MismatchedTokenException(24!=155)

这个翻译的原文

我导入的文件

这个才是正确的数据格式

解决问题

发现解决不了

这里写的就是有问题

错误的写法是 Input

正确的是 inpath

总是出现这个错误,我不知道怎么了

我就是在这个服务器上面还是还是没有成功

使用这个方式突然成功了

数据也没有问题

创建数据集表

数据

上传

结果

查询插入(时间慢)

INSERT INTO table student04 select id,name from student01 ;

这个时间大概有一个1分钟了把

练习sql

选择库

shell 复制代码
use test;

创建数据表的方式

shell 复制代码
CREATE table student04(
id int,
namet string
)
row format delimited
fields terminated by ',';

数据格式

加载本地数据库

shell 复制代码
load data local input '/root/hivedata/student.txt' into table student;

数据清理

有一些数据为空我们不需要如何进行处理的方式

我们只想要获取时间数据的方式

经纬度是一个数据如何分成俩个数据的方式

清理为空的数据

LENGTH(sender_gps) = 0

shell 复制代码
SELECT msg_time,sender_name,sender_gps from 
tb_msg_source 
WHERE  LENGTH(sender_gps) = 0
limit 10

获取时间段的数据

SUBSTR(msg_time,12,16)

shell 复制代码
select SUBSTR(msg_time,12,16) from tb_msg_source limit 10; 

分割数据的方式

split(sender_gps,",")[1]

shell 复制代码
SELECT split(sender_gps,",")[1] from tb_msg_source 
相关推荐
lisw051 小时前
AIoT(人工智能物联网):融合范式下的技术演进、系统架构与产业变革
大数据·人工智能·物联网·机器学习·软件工程
mtouch3331 小时前
GIS+VR地理信息虚拟现实XR MR AR
大数据·人工智能·ar·无人机·xr·vr·mr
数据智能老司机1 小时前
数据工程设计模式——实时摄取与处理
大数据·设计模式·架构
Hello.Reader3 小时前
Flink 内置 Watermark 生成器单调递增与有界乱序怎么选?
大数据·flink
工作中的程序员4 小时前
flink UTDF函数
大数据·flink
工作中的程序员4 小时前
flink keyby使用与总结 基础片段梳理
大数据·flink
Hy行者勇哥4 小时前
数据中台的数据源与数据处理流程
大数据·前端·人工智能·学习·个人开发
00后程序员张4 小时前
RabbitMQ核心机制
java·大数据·分布式
AutoMQ4 小时前
10.17 上海 Google Meetup:从数据出发,解锁 AI 助力增长的新边界
大数据·人工智能