登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
导读
排行榜
资讯
发帖说明
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
小组
VIP申请
VIP网盘
网盘
联系我们
发帖说明
道具
勋章
任务
淘帖
动态
分享
留言板
导读
设置
我的收藏
退出
腾讯QQ
微信登录
1
2
/ 2 页
下一页
返回列表
首页
›
业界区
›
业界
›
音频克隆:对话文本到口语对话生成MOSS-TTSD ...
音频克隆:对话文本到口语对话生成MOSS-TTSD
[ 复制链接 ]
俏襟选
2025-7-15 14:23:08
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
<br>之前介绍过几个音频克隆的可以项目:<br>CosyVoice:https://www.cnblogs.com/cj8988/p/18975495<br>IndexTTS:https://www.cnblogs.com/cj8988/p/18973016<br>GPT-SoVITS:https://www.cnblogs.com/cj8988/p/18962212<br><br>IndexTTs-多人:https://www.cnblogs.com/cj8988/p/18973609<br><br><br><strong>本章在介绍一个多人对话的(两人对话)开源项目(8GPU可以跑):MOSS-TTSD</strong><br><br><strong>亮点:<br></strong><br><strong>高度富有表现力的对话语音</strong>:MOSS-TTSD 基于统一的语义声学神经音频编解码器、预先训练的大型语言模型、数百万小时的 TTS 数据以及 40 万小时的合成和真实对话语音,可生成具有自然对话韵律的高度富有表现力、类似人类的对话语音。<br><strong>双人语音克隆</strong>:MOSS-TTSD 支持零样本双人语音克隆,并可根据对话脚本生成具有准确说话人切换的对话语音。<br><strong>中英双语支持</strong>:MOSS-TTSD 能够以中文和英文生成极具表现力的语音。<br><strong>长篇语音生成</strong>:得益于低比特率编解码器和训练框架的优化,MOSS-TTSD 已经可以进行长篇语音生成的训练。<br><strong>完全开源和商业就绪</strong>:MOSS-TTSD 及其未来更新将完全开源并支持免费商业使用。<br><br><strong>下载安装:<br></strong><br>开源地址:https://github.com/OpenMOSS/MOSS-TTSD<br><br>模型下载:https://huggingface.co/fnlp/XY_Tokenizer_TTSD_V0/tree/main<br>模型存放位置在现在的文件夹下:<strong>MOSS-TTSD\XY_Tokenizer\weights\<br><br></strong>官方文档:https://www.open-moss.com/cn/moss-ttsd/<strong><br><br></strong>
复制代码
安装:<br>进入window的虚拟环境conda中:<br><br>
复制代码
创建环境:
conda create -n moss_ttsd python=3.10<br><br>激活环境:
conda activate moss_ttsd<br><br>安装:
pip install -r requirements.txt<br><br>加速:这个先使用下面的命名安装,如果成功那就皆大欢喜
#pip install flash-attn
复制代码
<br><strong>如果flash-attn安装失败,就不用折腾了,我用了很多方法好像都没有成功,所以修改代码,不使用flash-attn。<br></strong><br><strong>修改generation_utils.py:找到load_model()函数</strong><br><strong>将参数默认值修改一下 attn_implementation="flash_attention_2"</strong><br><strong>修改为attn_implementation="sdpa"</strong><br><br><br>
复制代码
运行:python gradio_demo.py
复制代码
<br>第一次运行时会下载模型:fnlp/MOSS-TTSD-v0.5,需要很长的时间。<br>
复制代码
下载完成后,浏览器访问:http://127.0.0.1:7860/<br><br>注意,我试过Single单音频支持不太好(我的音频只有一个人说话,估计两个人说话还是可以的),所以这里直接使用两个音频进行实验。
复制代码
结果:
复制代码
音频1
音频2
合成音频
你的浏览器不支持 audio 标签。
你的浏览器不支持 audio 标签。
你的浏览器不支持 audio 标签。
<br><br>
复制代码
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
对话
音频
克隆
文本
口语
相关帖子
如何通过 C# 实现 PDF 文本提取?
低代码 + AI = 对话方式生成UI
文本生成任务评估指标
Spring with AI (3): 定制对话——Prompt模板引入
Spring with AI (3): 定制对话——Prompt模板引入
通义深度搜索-生成对话
岐金兰方案:为智能时代设计的元对话协议 ——一种基于“价值原语”的对话伦理学构想
AI元人文的对话与展开 ——自感痕迹论与当代思想的交汇
Pretext:值得关注的文本排版引擎
Trae国际版本中对话历史查询
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
业界
如何通过 C# 实现 PDF 文本提取?
3
143
褥师此
2026-03-02
业界
低代码 + AI = 对话方式生成UI
1
333
屠焘
2026-03-09
安全
文本生成任务评估指标
1
476
刘凤
2026-03-10
业界
Spring with AI (3): 定制对话——Prompt模板引入
0
548
揭荸
2026-03-17
业界
Spring with AI (3): 定制对话——Prompt模板引入
0
43
镝赋洧
2026-03-17
业界
通义深度搜索-生成对话
0
759
溶绚
2026-03-18
安全
岐金兰方案:为智能时代设计的元对话协议 ——一种基于“价值原语”的对话伦理学构想
1
706
刃减胸
2026-03-20
安全
AI元人文的对话与展开 ——自感痕迹论与当代思想的交汇
0
537
蓬森莉
2026-03-26
业界
Pretext:值得关注的文本排版引擎
0
913
溧久苟
2026-03-30
科技
Trae国际版本中对话历史查询
0
716
蝌棚煌
2026-04-01
回复
(29)
娥搽裙
2025-11-12 16:38:59
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
过来提前占个楼
喳谍
2025-11-20 22:14:20
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
分享、互助 让互联网精神温暖你我
挽幽
2025-11-22 11:00:27
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
收藏一下 不知道什么时候能用到
卒挪
2025-12-7 09:43:19
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢楼主提供!
后沛若
2025-12-11 11:11:33
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
感谢分享,学习下。
左丘平莹
2026-1-6 12:37:07
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢分享,辛苦了
周冰心
2026-1-19 11:49:35
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
很好很强大 我过来先占个楼 待编辑
饨篦
2026-1-20 09:47:46
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
谢谢楼主提供!
轨项尺
2026-1-21 14:36:02
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
这个好,看起来很实用
汤流婉
2026-1-22 23:05:20
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
这个好,看起来很实用
宁觅波
2026-1-29 01:55:07
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢,下载保存了
赖琳芳
2026-2-3 05:49:10
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,下载保存了,貌似很强大
蜴间囝
2026-2-4 06:41:07
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
懂技术并乐意极积无私分享的人越来越少。珍惜
挠溃症
2026-2-8 20:23:32
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
前排留名,哈哈哈
旁拮猾
2026-2-9 02:07:12
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
东西不错很实用谢谢分享
盛天欣
2026-2-9 03:00:48
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢楼主提供!
瘴锲如
2026-2-9 13:21:39
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
感谢分享,学习下。
挠溃症
2026-2-10 10:53:50
回复
使用道具
举报
照妖镜
猛犸象科技工作室:
网站开发,备案域名,渗透,服务器出租,DDOS/CC攻击,TG加粉引流
谢谢分享,试用一下
赘暨逢
2026-2-10 14:48:31
回复
使用道具
举报
照妖镜
程序园永久vip申请,无限下载程序园所有程序/软件/数据/等
不错,里面软件多更新就更好了
下一页 »
1
2
/ 2 页
下一页
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
俏襟选
2026-2-10 14:48:31
关注
0
粉丝关注
21
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
3934307807
991125
anyue1937
9994892
kk14977
6845359
4
xiangqian
638210
5
神泱
9529
6
韶又彤
9911
7
荪俗
9022
8
宋子
9874
9
蓬森莉
9870
10
俞瑛瑶
10000
查看更多
今日好文热榜
419
pgbouncer连接池设置与压力测试的最大连接
666
pgbouncer连接池设置与压力测试的最大连接
885
.NET 8 性能优化实战:让你的应用起飞
924
网页端3D编程小实验-一种多人自走棋游戏原
732
pgbouncer连接池设置与压力测试的最大连接
850
基于 Irrlicht 和 WASAPI 的 Simple Audio
553
pgbouncer连接池设置与压力测试的最大连接
680
pgbouncer连接池设置与压力测试的最大连接
581
pgbouncer连接池设置与压力测试的最大连接
536
pgbouncer连接池设置与压力测试的最大连接
472
.NET 8 性能优化实战:让你的应用起飞
536
.NET 8 性能优化实战:让你的应用起飞
235
.NET 8 性能优化实战:让你的应用起飞
787
.NET 8 性能优化实战:让你的应用起飞
792
pgbouncer连接池设置与压力测试的最大连接
221
pgbouncer连接池设置与压力测试的最大连接
559
pgbouncer连接池设置与压力测试的最大连接
831
pgbouncer连接池设置与压力测试的最大连接
257
pgbouncer连接池设置与压力测试的最大连接
300
Java虚拟线程实战:Project Loom让并发编程