新型多任务联合的语音识别训练架构和方法[发明专利]

2020-01-14 来源：意榕旅游网

专利内容由知识产权出版社提供

专利名称：新型多任务联合的语音识别训练架构和方法专利类型：发明专利发明人：徐波

申请号：CN201911019755.5申请日：20191024公开号：CN110875035A公开日：20200310

摘要：本发明公开了一种新型多任务联合的语音识别训练架构和方法，属于智能语音领域，包括Seq2seq模型和联结时序分类模型，Seq2seq模型用于编码语音或频谱，提取高维特征，根据上下文向量、注意力向量以及输入标签来逐步解码，并输出发音单元；所述联结时序分类模型用于辅助训练所述Seq2seq模型的语音、发音对齐，按照权重计算损失值，根据所述Seq2seq模型的损失值得到总损失值，使用反向传播算法更新所述Seq2seq模型的参数。联结时序分类部分能帮助Seq2seq模型在音频和文字间单调对齐，同时能使注意力模块更快收敛，减少了训练阶段和推理阶段的无规律的对齐。

申请人：广州多益网络股份有限公司,广东利为网络科技有限公司,多益网络有限公司

地址：510530 广东省广州市萝岗区伴河路90号自编一栋301房

国籍：CN

代理机构：北京联瑞联丰知识产权代理事务所(普通合伙)

代理人：赵娜

更多信息请下载全文后查看

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文

全部栏目

新型多任务联合的语音识别训练架构和方法[发明专利]