CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名鲁棒的口语翻译方法研究
作者王世宁
答辩日期2022-11-25
文献子类硕士
关键词口语翻译 鲁棒神经机器翻译 不流利现象 对比学习
英文摘要

口语是人与人之间相互交流的重要表达形式。在信息全球化的今天,世界各国的人们在经济、外交、文化等各个领域的口语交流日益密切,口语翻译作为打破语言障碍的关键技术受到广泛研究。口语翻译旨在将源语言的语音或转录结果翻译成目标语言的语音或文本。与书面语翻译相比,口语中有很多不同的语言现象,并且口语文本通常来自于语音识别的结果,包含着识别错误和噪声。因此,如何建立针对口语特点的噪声鲁棒的翻译模型,对于口语翻译研究具有重要的意义。现有的口语翻译系统通常设计独立的降噪模块以降低口语现象和噪声数据对于翻译模型的影响,但会导致模型规模大、翻译时延高等问题。为此,本文设计了新颖的模型和方法,旨在通过端到端的方式提升口语翻译模型对于非规范语言现象(不流利现象)和识别错误两类噪声的鲁棒性。论文的主要工作和创新如下:

    1. 提出了一种面向不流利语言现象的鲁棒口语翻译方法

    机器翻译方法对于新闻等书面语翻译可以取得较好的效果,但口语文本往往存在冗余、重复、修正、重述等不流利语言现象,与书面语相比有较大的差异,导致口语翻译的性能远不及书面语翻译。为此,本文提出了一种融合不流利检测的和口语翻译的多任务学习方法。该方法首先利用不流利检测技术识别句子中的不流利成分,继而通过额神经外的损失函数降低注意力机制对于不流利词语的关注程度,以增强编码器和解码器在不流利文本上的建模能力。此外,考虑到包含不流利现象的双语平行语料十分稀缺,本文提出了一种不流利文本合成方法以模拟真实口语的分布。在汉英翻译任务上的实验结果表明,所提方法可以有效提高不流利文本上的翻译质量。

    2. 提出了一种面向语音识别错误的鲁棒口语翻译方法

    神经机器翻译系统极易受到输入噪声的干扰,特别是在口语翻译中,翻译模块的输入来自语音识别模块的输出,而后者不可避免地存在着识别错误,对翻译性能造成很大的影响。现有方法通常采用错误修正与翻译模块级联式的策略以减少识别错误造成的影响,但易导致系统时延增长,且可能引入额外的噪声。为此,本文提出了一种基于对比学习的噪声鲁棒的口语翻译方法,该方法将包含识别错误的样本作为正例,通过句子级别或词级别的对比损失,分别从整体和局部两种不同角度拉近含噪声文本与干净文本在表示空间中的距离,以降低识别错误对文本表示的影响。同时,本文还设计了多种精细化的错误合成方法以模拟真实的语音识别错误。在英汉双向多个数据集上的实验表明,本文所提出的方法可以有效降低语音识别错误对翻译性能的影响,从而提高模型的鲁棒性。

    综上所述,本文针对口语翻译的特点和存在的问题展开了深入研究,分别从不流利现象和识别错误两个方面出发,提出了基于多任务学习和对比学习的口语翻译方法以增强翻译模型对于噪声数据的鲁棒性。最终实验证实了本文所提出的方法能够有效提升口语翻译模型的翻译质量。

语种中文
页码72
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/50595]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
王世宁. 鲁棒的口语翻译方法研究[D]. 2022.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace