您的当前位置:首页正文

新型多任务联合的语音识别训练架构和方法[发明专利]

2020-01-14 来源:意榕旅游网
专利内容由知识产权出版社提供

专利名称:新型多任务联合的语音识别训练架构和方法专利类型:发明专利发明人:徐波

申请号:CN201911019755.5申请日:20191024公开号:CN110875035A公开日:20200310

摘要:本发明公开了一种新型多任务联合的语音识别训练架构和方法,属于智能语音领域,包括Seq2seq模型和联结时序分类模型,Seq2seq模型用于编码语音或频谱,提取高维特征,根据上下文向量、注意力向量以及输入标签来逐步解码,并输出发音单元;所述联结时序分类模型用于辅助训练所述Seq2seq模型的语音、发音对齐,按照权重计算损失值,根据所述Seq2seq模型的损失值得到总损失值,使用反向传播算法更新所述Seq2seq模型的参数。联结时序分类部分能帮助Seq2seq模型在音频和文字间单调对齐,同时能使注意力模块更快收敛,减少了训练阶段和推理阶段的无规律的对齐。

申请人:广州多益网络股份有限公司,广东利为网络科技有限公司,多益网络有限公司

地址:510530 广东省广州市萝岗区伴河路90号自编一栋301房

国籍:CN

代理机构:北京联瑞联丰知识产权代理事务所(普通合伙)

代理人:赵娜

更多信息请下载全文后查看

因篇幅问题不能全部显示,请点此查看更多更全内容