新一代 Kaldi¶ 新一代 Kaldi 是一个开源的智能语音工具集,几乎涵盖了构建智能语音系统的方方面面。下图简单罗列了新一代 Kaldi 的项目矩阵,包括数据、训练到部署全链条。更多的项目见项目的 github 主页。 你也可以从这篇旧文中了解新一代 Kaldi 的起源与故事。
特性及功能¶ 智能语音领域包含非常多的子任务和子领域,新一代 Kaldi 目前支持语音识别(ASR)、语音合成(TTS)、关键词检测(KWS)、话音检测(VAD)、说话人识别(Speaker identification)、语种识别(Spoken language identification) 等等。其中有些提供了包含训练和部署全链路的技术,有些是基于优秀的第三方开源库做的部署支持,具体细节如下所示:
任务 训练 部署 相关文档 语音识别(ASR) 训练 部署 语音合成(TTS) 训练 部署 关键词(KWS) 训练 部署 话音检测(VAD) 部署 说话人识别(Speaker identification) 部署 语种识别(Spoken language identification) 部署 2024年3月31日 2023年4月25日 GitHub 评论 如果您通过 github 登录评论有困难,可以在留言板把你的问题告诉我们。 您也可以加入我们的微信和QQ群与广大开发者一起交流,也欢迎大家关注我们的微信公众号。