LiveTalking 2.0 发布:重构数字人底层架构,全面拥抱插件化!

各位开发者期待已久的 LiveTalking 2.0 终于在 GitHub 正式发布啦!🎉

本次 v2.0 版本的更新,不是简单的小修小补,而是一次**"伤筋动骨"的底层代码大重构**。在这个版本中,我们听取了社区大量的反馈,将整个项目的扩展性、代码规范性和接入自由度提升到了一个全新的高度。

如果你一直关注并使用 LiveTalking,那么这次更新的"硬核"技术点,绝对不容错过!👇


🧩 01. 万物皆可 Plugin:数字人模型与语音的插件化接入

随着开源生态的发展,越来越多样化的 AI 引擎涌现。为了让大家能以最低成本接入自己喜欢的模型,我们在 2.0 版本中抛弃了原来强耦合的调用方式。

数字人重构为插件化 (Plugin) 系统

现在,无论是核心的数字人模型TTS 语音合成 ,还是后端的媒体流传输方式 ,全部都改为了按需配置的 Plugin 方式接入

这意味着,你可以像搭积木一样,轻松拔插不同的 TTS 和虚拟人引擎,而无需对主流程代码进行破坏性修改!


🏗 02. 代码结构的"断舍离"与"抽象封装"

为了让二次开发更加顺畅,我们对项目的目录结构进行了一次彻底的梳理与收纳:

  • 统一核心底座 (BaseAvatar & BaseAsr)

    在早期的版本中,各个模型的代码往往有大量重复。本次更新,我们将 数字人推理面部回贴 的公共基础代码统一收拢到了 BaseAvatar 基类中;同样,音频特征的切分逻辑也一并整合到了 BaseAsr 中。现在,各个新模型只需要关注并实现自己最核心的特有逻辑即可! 开发一款新模型插件的代码量大幅下降。

  • 聚合专属模型目录 (avatars)

    原先分散的数字人模型逻辑和音频特征分析代码,现在被干净利落地迁移到了 avatars 目录下。项目工程结构一目了然。


📡 03. 流媒体再进化:独立 streamout 与 RTMP 加持

一直以来,数字人渲染后的画面如何顺滑、快速地推流出去,都是部署到直播环境时的痛点所在。

在 2.0 版本中,我们将传输方式彻底抽离成了并列的单独类 ,放置于专属的 streamout 目录下进行隔离管理。更令人振奋的是,本次更新原生地加入了社区呼声极高的 RTMP 输出支持

从此,使用 LiveTalking 对接 B站、抖音、视频号或是自定义直播流媒体服务器,将变得前所未有的丝滑。


🗣 04. 语音新干将:新增阿里云 QwenTTS

除了架构上的全面重构,我们在业务侧也持续引入优秀的生态力量。

本次 v2.0 更新正式加入了对阿里云通义千问 QwenTTS 的支持!强大的大模型驱动语音生成,将为数字人的拟真度和情感表达带来更加惊艳的效果。


🗺 总结与架构全景概览

如果说 v1.x 版本证明了 LiveTalking 的跑通能力,那么 v2.0 则标志着它正在向一个扩展性极强、架构高度规范的开源数字人框架平台迈进。

从底层抽象 BaseAvatar 到顶层 streamout,再到灵活的 Plugin 插件机制,这一切都为了让开发者能以更低的门槛,打造属于自己的定制化全双工 AI 交互数字人。

✨ 快速体验与升级指南:

欢迎前往 GitHub 仓库获取最新的代码!

🔗 项目地址https://github.com/lipku/LiveTalking

🔗 国内镜像https://gitee.com/lipku/LiveTalking

你的每一个 ⭐️ Star 都是对开源最大的鼓励。如果你在升级或使用中遇到任何问题,欢迎随时在 Issue 区或者社区群找我们交流!咱们下个版本见!👋

相关推荐
梦梦代码精8 小时前
为什么这个开源的AI平台会火?有点东西。。。
人工智能·算法·机器学习·docker·开源
sbjdhjd12 小时前
04(上)| k8s中的微服务
微服务·云原生·kubernetes·开源·云计算·excel·kubelet
sbjdhjd12 小时前
面试题完结 | 投票题 + 到岗时间 + 压力缓解
经验分享·笔记·面试·职场和发展·开源·求职招聘·印象笔记
DogDaoDao12 小时前
【GitHub】AutoGPT 深度技术解析:开源自主 AI Agent 平台架构全解
人工智能·程序员·开源·github·ai编程·ai agent·智能体
狗凯之家源码网14 小时前
APP 软件官网整站源码效果实测与价值解析
开源·php
Hommy8815 小时前
【开源剪映小助手】项目概述
开源·剪映小助手·视频剪辑自动化
CJH(本人账号)15 小时前
AI Agent 安全危机:当你的“智能助手“变成攻击者的“远程武器“
网络·人工智能·安全·ai·开源·github
henrylin999915 小时前
开源量化软件功能介绍
python·开源
AI_零食16 小时前
鸿蒙原生 ArkTS:margin 溢出、Row 弹性分配与 alignItems 的交互
学习·华为·开源·harmonyos·鸿蒙·鸿蒙系统
爱上纯净的蓝天16 小时前
30 分钟上手 AtomCode:用它写一个 Python 批量整理文件/改名/生成报告小工具(新手教程)
python·开源·自动化脚本·atomcode·ai 编码助手