生成长篇小说的朗读语音小说

使用chattts的兄弟都知道,它只支持30s的朗读,所以如果要使用篇的话,就需要想一些别的办法,我现在使用的办法是:

  1. 将长篇小说按章节进行分拆

    使用用正则表达式从文件中取出每个章节

  2. 将每个章节按自然语言的语句来分折每一个语句 主要是由通过nlp,将章节进行分段处理生个语句,将每个语句中加入相应的语气词,保障每个语句是在30s以内。

  3. 将每个语句生成一个文件,将每个章节的语音进行合并成一个mp3文件

5. 通过视频生成工具将文件转成mp4

scss 复制代码
Path(source_directory + Path(self.get_file_name()).stem).mkdir(parents=True, exist_ok=True)

output_file_wav = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.wav'

cmd = ["ffmpeg","-safe", "0","-f", "concat","-i", self.save_dir + "input.txt","-c", "copy", "-y",f"{output_file_wav}"]

log.info(" ".join(cmd))

subprocess.run(cmd, check=True)

# 删除

Path(self.save_dir + "input.txt").unlink()

for wav in wav_list:

Path(wav).unlink()

# 将文件转换成mp3

output_file_mp3 = source_directory + Path(self.get_file_name()).stem + '/' + Path(self.get_nlp_file()).stem + '.mp3'

cmd_to_mp3 = [

"ffmpeg",

"-i", f"{output_file_wav}",

f"{output_file_mp3}"

]

log.info(" ".join(cmd_to_mp3))

subprocess.run(cmd_to_mp3, check=True)

# 删除wav文件

Path(output_file_wav).unlink()
相关推荐
葫芦和十三1 小时前
图解 MongoDB 21|选举与 failover:Primary 是怎么选出来的
后端·mongodb·agent
GetcharZp2 小时前
26k Star 开源内网穿透神器 NetBird,一分钟实现全球设备互联!
后端
考虑考虑2 小时前
Mybatis实现批量插入
java·后端·mybatis
咖啡八杯3 小时前
GoF设计模式——中介者模式
java·后端·spring·设计模式
lizhongxuan5 小时前
多Agent之间的区别
后端
杨充7 小时前
1.面向对象设计思想
后端
IT_陈寒8 小时前
Java的Date类又坑了我一次,改用时间戳真香
前端·人工智能·后端
systemPro8 小时前
2.6亿条设备数据,历史查询从超时到50ms,我做了什么
后端
要阿尔卑斯吗8 小时前
提示词优化启示:为什么“按顺序输出“比“关键度评分“更有效
后端
她的男孩9 小时前
后台接口加密别只会 HTTPS,ForgeAdmin 的 RSA + SM4/AES 源码拆解
后端·面试·开源