题名 | 基于可解释性分析的神经机器翻译不确定性研究 |
作者 | 卢宇 |
答辩日期 | 2022-05 |
文献子类 | 博士 |
关键词 | 神经机器翻译 数据不确定性 注意力机制不确定性 预测不确定性 |
英文摘要 | 近年来,机器翻译技术快速发展,译文质量不断提升。其中,基于神经网络的机器翻译技术表现出色,已成为机器翻译领域的主流方法。神经网络作为一种“黑盒”技术,包含亿级的参数量和复杂的网络结构,因此具有极强的学习能力,可以通过自动探测关联特征做出最终的决策。然而,这些特征表示分布在高维连续空间中,对人来说难以理解,研发者也难以探究模型结果的生成过程,且该过程易受到各种不确定性因素的影响。这种不确定性体现在:数据分布和模型参数的波动造成模型结果不可预测,给模型的稳定性带来威胁,导致使用者无法判断何时可以信任模型结果。因此,研究神经机器翻译模型中各个模块的运作机理,定位不确定性的来源,分析不确定性的影响,以减少不确定性带来的干扰具有十分重要的研究意义和应用价值。本文围绕数据收集、跨语言知识建模和译文概率预测这三个神经机器翻译的关键阶段,研究数据不确定性、注意力机制不确定性及预测不确定性,利用可解释性技术分析不确定性对模型结果的影响,通过不确定性的降低提高翻译质量,并对模型可能出现的错误进行预判。 |
语种 | 中文 |
学科主题 | 自然语言处理 |
页码 | 108 |
内容类型 | 学位论文 |
源URL | [http://ir.ia.ac.cn/handle/173211/51867] |
专题 | 毕业生_博士学位论文 |
推荐引用方式 GB/T 7714 | 卢宇. 基于可解释性分析的神经机器翻译不确定性研究[D]. 2022. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论