[Spark] 读取项目下resources/的文件

背景

这个spark程序要读取项目下的一些文件, 当我把这个项目打成jar包后, spark-submit到集群后执行

将文件作为资源文件打包到 JAR 中可以通过 Maven 或 sbt 这样的构建工具完成。以下是使用 Maven 的步骤:

  1. 首先,在你的 Maven 项目中创建一个目录(比如 src/main/resources)用来存放资源文件。

  2. 将需要打包的文件放入这个目录下
    src/main/resources/aaaaaa.txt

  3. 在 Maven 项目的 pom.xml 文件中,添加以下配置,告诉 Maven 应该将这些文件打包到 JAR 中:

xml 复制代码
<build>
    <resources>
        <resource>
            <directory>src/main/resources</directory>
            <includes>
                <include>**/*</include>
            </includes>
        </resource>
    </resources>
</build>
  1. 然后使用 mvn package 命令构建你的项目,Maven 会自动将资源文件打包到生成的 JAR 文件中。

在程序中,你可以使用 getResourceAsStream 方法来读取这些资源文件,例如:

scala 复制代码
val inputStream = getClass.getResourceAsStream("/aaaaaa.txt")
val fileContent = scala.io.Source.fromInputStream(inputStream).getLines().mkString("\n")

通过上述步骤,你就可以将文件作为资源文件打包到 JAR 中,并在程序中正常读取这些文件了。希望对你有所帮助!

相关推荐
TOYOAUTOMATON5 分钟前
自动化工业夹爪
大数据·人工智能·算法·目标检测·机器人
浩浩测试一下16 分钟前
C&&汇编中的调用约定
大数据·汇编·安全·web安全·网络安全·系统安全
鹿衔`24 分钟前
CDH 6.3.2 集群外挂部署 Spark 3.5.7 连接 Paimon 1.1.1 (二)
大数据·分布式·spark
aitoolhub1 小时前
课程表模板在线制作:稿定设计的实用方案
大数据·深度学习·教育电商·在线设计·教育培训
CrazyClaz2 小时前
分布式事务专题3
分布式·分布式事务
2301_800256112 小时前
8.3 查询优化 核心知识点总结
大数据·数据库·人工智能·sql·postgresql
samFuB2 小时前
【工具变量】全国社保落户制度改革城市DID数据(2010-2025年)
大数据
互联网资讯2 小时前
融合AI大模型的Geo优化系统服务商如何选?避坑指南
大数据·人工智能·ai搜索优化·geo系统·geo优化系统·geo系统搭建
搞科研的小刘选手2 小时前
【广东财经大学主办】2026年人工智能与金融科技国际学术会议(IC-AIF 2026)
大数据·人工智能·金融·学术会议
绿蕉2 小时前
智能底盘:汽车革命的“新基石”
大数据·人工智能