基于可解释性分析的神经机器翻译不确定性研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 博士学位论文

题名	基于可解释性分析的神经机器翻译不确定性研究
作者	卢宇
答辩日期	2022-05
文献子类	博士
关键词	神经机器翻译数据不确定性注意力机制不确定性预测不确定性
英文摘要	近年来，机器翻译技术快速发展，译文质量不断提升。其中，基于神经网络的机器翻译技术表现出色，已成为机器翻译领域的主流方法。神经网络作为一种“黑盒”技术，包含亿级的参数量和复杂的网络结构，因此具有极强的学习能力，可以通过自动探测关联特征做出最终的决策。然而，这些特征表示分布在高维连续空间中，对人来说难以理解，研发者也难以探究模型结果的生成过程，且该过程易受到各种不确定性因素的影响。这种不确定性体现在：数据分布和模型参数的波动造成模型结果不可预测，给模型的稳定性带来威胁，导致使用者无法判断何时可以信任模型结果。因此，研究神经机器翻译模型中各个模块的运作机理，定位不确定性的来源，分析不确定性的影响，以减少不确定性带来的干扰具有十分重要的研究意义和应用价值。本文围绕数据收集、跨语言知识建模和译文概率预测这三个神经机器翻译的关键阶段，研究数据不确定性、注意力机制不确定性及预测不确定性，利用可解释性技术分析不确定性对模型结果的影响，通过不确定性的降低提高翻译质量，并对模型可能出现的错误进行预判。
语种	中文
学科主题	自然语言处理
页码	108
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/51867]
专题	毕业生_博士学位论文
推荐引用方式 GB/T 7714	卢宇. 基于可解释性分析的神经机器翻译不确定性研究[D]. 2022.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们