CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名基于可解释性分析的神经机器翻译不确定性研究
作者卢宇
答辩日期2022-05
文献子类博士
关键词神经机器翻译 数据不确定性 注意力机制不确定性 预测不确定性
英文摘要

近年来,机器翻译技术快速发展,译文质量不断提升。其中,基于神经网络的机器翻译技术表现出色,已成为机器翻译领域的主流方法。神经网络作为一种“黑盒”技术,包含亿级的参数量和复杂的网络结构,因此具有极强的学习能力,可以通过自动探测关联特征做出最终的决策。然而,这些特征表示分布在高维连续空间中,对人来说难以理解,研发者也难以探究模型结果的生成过程,且该过程易受到各种不确定性因素的影响。这种不确定性体现在:数据分布和模型参数的波动造成模型结果不可预测,给模型的稳定性带来威胁,导致使用者无法判断何时可以信任模型结果。因此,研究神经机器翻译模型中各个模块的运作机理,定位不确定性的来源,分析不确定性的影响,以减少不确定性带来的干扰具有十分重要的研究意义和应用价值。本文围绕数据收集、跨语言知识建模和译文概率预测这三个神经机器翻译的关键阶段,研究数据不确定性、注意力机制不确定性及预测不确定性,利用可解释性技术分析不确定性对模型结果的影响,通过不确定性的降低提高翻译质量,并对模型可能出现的错误进行预判。

语种中文
学科主题自然语言处理
页码108
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/51867]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
卢宇. 基于可解释性分析的神经机器翻译不确定性研究[D]. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace