在上一个实验中我们筛选了竞赛网站日志数据中2021/1和2021/2的数据以序列化的形式写到了hdfs上。
data:image/s3,"s3://crabby-images/d1f07/d1f07a0179f7e340519304677c4abff579ed57f3" alt=""
接下来我们使用Java API 读取序列化的数据保存到磁盘中。
其他命令操作请参考:16 Java API操作HDFS-CSDN博客
1.我直接在上一个项目中test/java目录下创建com.maidu.selectdata.test.APITest类,test目录下的内容在打包时不会出现在jar文件中,仅供测试所用。
data:image/s3,"s3://crabby-images/0e363/0e363eae0e510102d9ef47db9b9fb47297453f79" alt=""
2.编写代码
data:image/s3,"s3://crabby-images/c33ab/c33ab75aa9b714bf2a8b4142b4ef94175560a3de" alt=""
data:image/s3,"s3://crabby-images/06c13/06c1307fba9b19d6dd17ca048e2a201d6fbe0530" alt=""
3.运行 选择方法名右击运行
data:image/s3,"s3://crabby-images/93dae/93daededf647ce4b2935232119796d8250d8e258" alt=""
测试成功
data:image/s3,"s3://crabby-images/5130e/5130e2ef859992f5f24b17435d7f69dd6c303dfc" alt=""
4.进入D盘查看文件
data:image/s3,"s3://crabby-images/c50da/c50dad5d21b628ee2413d1830716539df6b09c58" alt=""
写入文件的数据
data:image/s3,"s3://crabby-images/f34eb/f34eb79ff7f14a5792627d5065d6c80e90370730" alt=""