卷积神经网络声学模型的结构优化和加速计算
王智超; 徐及; 张鹏远; 颜永红
刊名重庆邮电大学学报(自然科学版)
2018
卷号30期号:3页码:416-422
关键词语音识别 声学模型 卷积神经网络 矢量化
ISSN号1673-825X
DOI10.3979/j.issn.1673-825X.2018.03.017
英文摘要

将卷积神经网络(convolutional neural networks,CNN)声学模型应用于中文大词表连续电话语音识别任务中,分析了卷积层数、滤波器参数等变量对CNN模型性能的影响,最终在中文电话语音识别测试中,CNN模型相比传统的全连接神经网络模型取得了识别字错误率1.2%的下降。由于卷积结构的复杂性,常规的神经网络加速方法如定点量化和SSE指令加速等方法对卷积运算的加速效率较低。针对这种情况,对卷积结构进行了优化,提出了2种卷积矢量化方法:权值矩阵矢量化和输入矩阵矢量化对卷积运算进行改善。结果表明,输入矩阵矢量化方法的加速效率更高,结合激活函数后移的策略,使得卷积运算速度提升了8.9倍。

CSCD记录号CSCD:6268313
内容类型期刊论文
源URL[http://ir.xjipc.cas.cn/handle/365002/5416]  
专题新疆理化技术研究所_多语种信息技术研究室
作者单位1.中国科学院语言声学与内容理解重点实验室
2.中国科学院新疆理化技术研究所新疆民族语音语言信息处理实验室
推荐引用方式
GB/T 7714
王智超,徐及,张鹏远,等. 卷积神经网络声学模型的结构优化和加速计算[J]. 重庆邮电大学学报(自然科学版),2018,30(3):416-422.
APA 王智超,徐及,张鹏远,&颜永红.(2018).卷积神经网络声学模型的结构优化和加速计算.重庆邮电大学学报(自然科学版),30(3),416-422.
MLA 王智超,et al."卷积神经网络声学模型的结构优化和加速计算".重庆邮电大学学报(自然科学版) 30.3(2018):416-422.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace