登录
/
注册
首页
论坛
其它
首页
科技
业界
安全
程序
广播
Follow
关于
每日签到
每天签到奖励2圆-6圆
发帖说明
VIP申请
登录
/
注册
账号
自动登录
找回密码
密码
登录
立即注册
搜索
搜索
关闭
CSDN热搜
程序园
精品问答
技术交流
资源下载
本版
帖子
用户
软件
问答
教程
代码
写记录
写博客
VIP申请
VIP网盘
网盘
联系我们
每日签到
道具
勋章
任务
设置
我的收藏
退出
腾讯QQ
微信登录
返回列表
首页
›
业界区
›
业界
›
在 Hugging Face 上部署语音转语音模型
在 Hugging Face 上部署语音转语音模型
[ 复制链接 ]
胥望雅
2025-6-2 00:03:03
介绍
S2S (语音到语音) 是 Hugging Face 社区内存在的一个令人兴奋的新项目,它结合了多种先进的模型,创造出几乎天衣无缝的体验: 你输入语音,系统会用合成的声音进行回复。
该项目利用 Hugging Face 社区中的 Transformers 库提供的模型实现了流水话处理。该流程处理由以下组件组成:
声音活动检测 (VAD)
语音识别 (STT)
语言模型 (LLM)
文本转语音 (TTS)
除此之外,S2S 项目支持多语言!目前支持英语、法语、西班牙语、中文、日语和韩语。您可以使用单语言模式运行此流程或通过 auto 标志进行语言自动检测。请查看 这里 的仓库获取更多详情。
[code]>
来源:程序园用户自行投稿发布,如果侵权,请联系站长删除
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
语音
Hugging
Face
部署
模型
相关帖子
读大语言模型08计算基础设施
【译】模型上下文协议(MCP)现已在 Visual Studio 中正式发布
模型文件硬塞进 Git,GitHub 直接打回原形:使用Git-LFS管理大文件
读大语言模型09超级智能
读大语言模型10人工智能进化
读大语言模型11从自然中学习
读大语言模型12读后总结与感想兼导读
文生图模型Stable Diffusion使用详解
Redis容量评估模型
传统软件部署的痛点
vip免费申请,1年只需15美金$
回复
使用道具
举报
提升卡
置顶卡
沉默卡
喧嚣卡
变色卡
千斤顶
照妖镜
相关推荐
安全
读大语言模型08计算基础设施
0
79
赖琳芳
2025-08-27
业界
【译】模型上下文协议(MCP)现已在 Visual Studio 中正式发布
0
694
单于易槐
2025-08-27
业界
模型文件硬塞进 Git,GitHub 直接打回原形:使用Git-LFS管理大文件
0
150
巨到
2025-08-28
安全
读大语言模型09超级智能
0
78
瞧厨
2025-08-28
安全
读大语言模型10人工智能进化
0
79
水苯
2025-08-29
安全
读大语言模型11从自然中学习
0
68
驼娑
2025-09-02
科技
读大语言模型12读后总结与感想兼导读
0
40
百杲憔
2025-09-03
业界
文生图模型Stable Diffusion使用详解
0
268
县挫伪
2025-09-11
安全
Redis容量评估模型
0
370
姬宜欣
2025-09-12
安全
传统软件部署的痛点
0
779
扈怀易
2025-09-12
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
回复
本版积分规则
回帖并转播
回帖后跳转到最后一页
签约作者
程序园优秀签约作者
发帖
胥望雅
2025-6-2 00:03:03
关注
0
粉丝关注
15
主题发布
板块介绍填写区域,请于后台编辑
财富榜{圆}
敖可
9984
杭环
9988
凶契帽
9988
4
氛疵
9988
5
黎瑞芝
9988
6
猷咎
9986
7
里豳朝
9986
8
肿圬后
9986
9
蝓俟佐
9984
10
虽裘侪
9984
查看更多