基于BLSTM的语音识别解码优化算法
邬龙; 黎塔; 王丽; 颜永红
2017
会议日期2017-09-22
会议地点中国黑龙江哈尔滨
关键词双向长短时记忆神经网络(bidirectional Long Short-term Memory Blstm)如今已经广泛用于自动语音识别(automatic Speech Recognition Asr)[1]的声学建模。虽然1其较传统的声学建模方法有很大优势但是需要用到整句递归计算每一帧的后验概率 解码延迟和实时率无法得到有效保证 因而限制了这种神经网络在实时场景中的应用。为 此 本文在上下文相关块(Context Sensitive Chunk Csc) 解码算法的基础上 提出一种基于状态拷贝的csc 改进算法 即cpsc 算法。实验表明 该方法能够在精度不损失的情况下取得0.3~0.4倍的加速。
内容类型会议论文
源URL[http://ir.xjipc.cas.cn/handle/365002/5375]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.中国科学院声学研究所语言声学与内容理解重点实验室
2.中国科学院大学
3.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式
GB/T 7714
邬龙,黎塔,王丽,等. 基于BLSTM的语音识别解码优化算法[C]. 见:. 中国黑龙江哈尔滨. 2017-09-22.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace