Spark-SQL 四(实验)

用idea实验hive的常用代码

将数据放到项目·的目录下

代码实现

运行结果:

实验

统计有效数据条数用户数量最多的前二十个地址

将数据放到Spark-SQL/input目录下

代码实现:

运行结果:

相关推荐
从零开始学习人工智能15 分钟前
Doris 与 Elasticsearch:谁更适合你的数据分析需求?
大数据·elasticsearch·数据分析
爱编程的张同学26 分钟前
Spring Cloud Alibaba Seata安装+微服务实战
分布式·spring cloud·微服务
Gauss松鼠会1 小时前
GaussDB分布式数据库调优方法总结:从架构到实践的全链路优化指南
数据库·分布式·sql·database·gaussdb
广州山泉婚姻2 小时前
高并发场景下的智慧零工平台开发:Spring Boot 3+MyBatis-Flex架构深度实践
分布式·爬虫·云原生
TDengine (老段)2 小时前
TDengine 快速体验(Docker 镜像方式)
大数据·数据库·物联网·docker·时序数据库·tdengine·涛思数据
金融小师妹2 小时前
解码美元-黄金负相关:LSTM-Attention因果发现与黄金反弹推演
大数据·人工智能·算法
安科瑞刘鸿鹏2 小时前
双碳时代,能源调度的难题正从“发电侧”转向“企业侧”
大数据·运维·物联网·安全·能源
时序数据说3 小时前
时序数据库IoTDB数据模型建模实例详解
大数据·数据库·开源·时序数据库·iotdb
时序数据说3 小时前
时序数据库IoTDB结合SeaTunnel实现高效数据同步
大数据·数据库·开源·时序数据库·iotdb
q567315233 小时前
Java使用Selenium反爬虫优化方案
java·开发语言·分布式·爬虫·selenium