生成长篇小说的朗读语音小说

使用chattts的兄弟都知道,它只支持30s的朗读,所以如果要使用篇的话,就需要想一些别的办法,我现在使用的办法是:

  1. 将长篇小说按章节进行分拆

    使用用正则表达式从文件中取出每个章节

  2. 将每个章节按自然语言的语句来分折每一个语句 主要是由通过nlp,将章节进行分段处理生个语句,将每个语句中加入相应的语气词,保障每个语句是在30s以内。

  3. 将每个语句生成一个文件,将每个章节的语音进行合并成一个mp3文件

5. 通过视频生成工具将文件转成mp4

scss 复制代码
Path(source_directory + Path(self.get_file_name()).stem).mkdir(parents=True, exist_ok=True)

output_file_wav = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.wav'

cmd = ["ffmpeg","-safe", "0","-f", "concat","-i", self.save_dir + "input.txt","-c", "copy", "-y",f"{output_file_wav}"]

log.info(" ".join(cmd))

subprocess.run(cmd, check=True)

# 删除

Path(self.save_dir + "input.txt").unlink()

for wav in wav_list:

Path(wav).unlink()

# 将文件转换成mp3

output_file_mp3 = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.mp3'

cmd_to_mp3 = [

"ffmpeg",

"-i", f"{output_file_wav}",

f"{output_file_mp3}"

]

log.info(" ".join(cmd_to_mp3))

subprocess.run(cmd_to_mp3, check=True)

# 删除wav文件

Path(output_file_wav).unlink()
相关推荐
武子康1 分钟前
大数据-253 离线数仓 - Airflow 入门与任务调度实战:DAG、Operator、Executor 部署排错指南
大数据·后端·apache hive
IT_陈寒24 分钟前
深入理解JavaScript:核心原理与最佳实践
前端·人工智能·后端
树獭叔叔30 分钟前
GRPO:比PPO更简单的RLHF算法
后端·aigc·openai
shelter31 分钟前
并发操作session对象导致登录闪退问题
后端
兆子龙42 分钟前
TypeScript高级类型编程:从入门到精通
前端·后端
IT_陈寒1 小时前
Python开发者的效率革命:这5个技巧让你的代码提速50%!
前端·人工智能·后端
MekoLi291 小时前
Spring AI 与 LangChain4j 从入门到精通:Java 后端开发者的 AI 实战手册
后端·面试
树獭叔叔1 小时前
从RLHF到PPO:让AI学会说人话
后端·aigc·openai
Meepo_haha1 小时前
创建Spring Initializr项目
java·后端·spring
Memory_荒年1 小时前
SpringBoot事务源码深度游:从注解到数据库的“奇幻漂流”
java·后端·spring