Vibe Voice - 微软开源 AI 语音框架

https://github.com/microsoft/VibeVoice

VibeVoice 是微软开源的 AI 语音框架,用于从文本生成富有表现力的长篇多说话人对话音频(如播客),通过 LLM 理解文本上下文和对话流,生成高保真音频。

长篇多说话人模型:支持最长 90 分钟音频、最多 4 个不同说话人的对话式语音合成
实时流式 TTS 模型:初始音频延迟约 300 毫秒,支持流式文本输入的实时语音生成
超低帧率语音分词器:以 7.5Hz 帧率的连续语音分词器保持音频保真度同时提升计算效率
多语言支持:支持英文、中文以及实验性支持 9 种语言(德、法、意、日、韩、荷、波、葡、西班牙语)
风格化语音:提供 11 种不同的英文风格语音供用户选择

#TTS #Voice #AI #GitHub GitHub - microsoft/VibeVoice: Open-Source Frontier Voice AI
#TTS

RealDubbing

AI 文本转语音工具,支持 50 多种语言和 300 多种不同的 AI 声音,最多支持 10000 字,支持声音试听和预览播放,且可使用停顿标签控制语音节奏,完全免费,无需注册。

https://realdubbing.com/zh

频道 @WidgetChannel
#TTS #AI

TTS Omni

AI 文本转语音工具,含有多个角色与多种语言,如果是非中文的文本,还可以选择语气风格,如友善、专业、真诚、愤怒、悲伤等,另可一键将文本翻译为目标语言,以及 AI 润色增强功能,最多支持 1000 个字符,不限次数,免费下载,无需注册。

https://www.ttsomni.com/zh
 
 
Back to Top