苏劲松,陈骏轩,陆紫耀,董怡帆,康立言,张海英.篇章神经机器翻译综述[J].情报工程,2020,6(5):004-014 |
篇章神经机器翻译综述 |
A Survey of Document-level Neural Machine Translation |
|
DOI:10.3772/j.issn.2095-915X.2020.05.001 |
中文关键词: 自然语言处理;篇章神经机器翻译;上下文建模;模型训练;模型分析 |
英文关键词: Natural language processing; Document-level NMT; context modeling; model training; model analysis |
基金项目:国家重点研发计划科技创新 2030—“ 新一代人工智能 ” 重大项目《以中文为核心的多语种自动翻译研究》课题《面向机器翻译的多模态多语言深度融合关键技术》2020AAA0108004;国家自然科学基金面上项目 “ 面向机器翻译的多层次语义表示研究 ” (61672440);福建省杰出青年基金项目 “ 多源神经机器翻译关键技术研究与应用 ”(2020J01312146)。 |
作者 | 单位 | 苏劲松 | 厦门大学信息学院 | 陈骏轩 | 厦门大学信息学院 | 陆紫耀 | 厦门大学信息学院 | 董怡帆 | 厦门大学信息学院 | 康立言 | 厦门大学信息学院 | 张海英 | 厦门大学信息学院 |
|
摘要点击次数: 2371 |
全文下载次数: 2084 |
中文摘要: |
篇章机器翻译旨在使用计算机将一个篇章从一种语言自动翻译成另一种语言,是机器翻译中一项富有挑战性的任务。近年来,随着神经机器翻译的快速发展,篇章神经机器翻译成为了机器翻译研究的热门方向。研究者们提出了许多基于神经网络的篇章机器翻译模型,并取得了不错的效果。相比于传统句子神经机器翻译,篇章神经机器翻译通过建模并利用篇章级别的上下文信息来产生质量更高的译文。本文首先简单介绍了篇章翻译任务的定义和特点;其次分三个方面对篇章神经机器翻译现有研究进行了介绍:上下文建模、模型训练、模型分析;最后分析了篇章神经机器翻译研究当前面临的主要难点,并探讨未来可能的研究方向。 |
英文摘要: |
Document-level machine translation aims to use a computer to automatically translate a whole document from one language to another, which is a challenging task in machine translation. In recent years, with the rapid development of neural machine translation (NMT), document-level NMT has become one of hot research topics in the community of machine translation. Various document-level machine translation models based on neural networks have been proposed and achieved good results. By modeling document-level context information, document-level NMT models significantly outperform conventional sentence-level NMT models. In this paper, we first briefly introduce the definition and characteristics of document-level NMT. Then, we review the studies in three aspects: context modeling, model training and model analysis. Finally, we analyze the main problems currently faced by document-level NMT and discuss possible future research directions. |
查看全文
查看/发表评论 下载PDF阅读器 |
关闭 |