生成长篇小说的朗读语音小说

使用chattts的兄弟都知道,它只支持30s的朗读,所以如果要使用篇的话,就需要想一些别的办法,我现在使用的办法是:

  1. 将长篇小说按章节进行分拆

    使用用正则表达式从文件中取出每个章节

  2. 将每个章节按自然语言的语句来分折每一个语句 主要是由通过nlp,将章节进行分段处理生个语句,将每个语句中加入相应的语气词,保障每个语句是在30s以内。

  3. 将每个语句生成一个文件,将每个章节的语音进行合并成一个mp3文件

5. 通过视频生成工具将文件转成mp4

scss 复制代码
Path(source_directory + Path(self.get_file_name()).stem).mkdir(parents=True, exist_ok=True)

output_file_wav = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.wav'

cmd = ["ffmpeg","-safe", "0","-f", "concat","-i", self.save_dir + "input.txt","-c", "copy", "-y",f"{output_file_wav}"]

log.info(" ".join(cmd))

subprocess.run(cmd, check=True)

# 删除

Path(self.save_dir + "input.txt").unlink()

for wav in wav_list:

Path(wav).unlink()

# 将文件转换成mp3

output_file_mp3 = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.mp3'

cmd_to_mp3 = [

"ffmpeg",

"-i", f"{output_file_wav}",

f"{output_file_mp3}"

]

log.info(" ".join(cmd_to_mp3))

subprocess.run(cmd_to_mp3, check=True)

# 删除wav文件

Path(output_file_wav).unlink()
相关推荐
夕颜1111 小时前
BeeAI 框架学习记录
后端
极市平台2 小时前
骁龙大赛-技术分享第5期(上)
人工智能·经验分享·笔记·后端·个人开发
程序员爱钓鱼2 小时前
Node.js 编程实战:路由处理原理与实践
后端·node.js·trae
hhzz3 小时前
Spring Boot整合Activiti的项目中实现抄送功能
java·spring boot·后端
Victor3564 小时前
Netty(7)如何实现基于Netty的TCP客户端和服务器?
后端
Victor3564 小时前
Netty(8)什么是Netty的ChannelPipeline和ChannelHandler?
后端
乘风!5 小时前
NSSM启动tomcat部署Java程序
java·服务器·后端·tomcat
代码无疆6 小时前
学点java字节码更易于理解一些特殊的java语法效果
java·后端
星浩AI6 小时前
AI 并不懂文字,它只认向量:一文搞懂 Embedding
后端
程序员博博6 小时前
这才是vibe coding正确的打开方式 - 手把手教你开发一个MCP服务
javascript·人工智能·后端