实用教程VibeVoice:开源前沿语音人工智能VibeVoice 是一套革命性的开源语音 AI 工具包,支持 60 分钟长音频 ASR 识别及 90 分钟多人对话 TTS 生成,凭借极低的实时延迟和强大的说话人一致性,定义了长篇语音处理的新标准。 VibeVoice 语音识别ASR 长篇TTS AI播客 开源模型