机器翻译挑战CET6翻译获“优秀”,未来能否替代人工翻译?

2018-12-19 17:01:32 来源: 中国科技网·科技日报 作者: 吴长锋

中国科技网·科技日报记者  吴长锋

2018年12月18日,合肥师范学院一间特殊的考场内,“考生”是科大讯飞一套机器翻译系统。

连考三道翻译题,每道题满分15分,它得到13分的均分。评分的是两位具有六级阅卷经验的高校资深专家,“这套机器翻译系统的表现让我们惊喜,翻译得很地道。”对于成绩,鉴定是:优秀!

达大学英语六级翻译“优秀”

六级翻译测试中,共有三道考题。按规定,考生们只需作答一题,时间是半小时。目前六级词汇量要求达到6000个,不乏生僻词汇和短语;由于汉英间表达习惯的不同,逻辑、语序调整也十分重要,因而每次通过率只有30%左右,也足以说明六级考试的不易。

在公证人员的见证下,考官分别打开三道考题,由人工输入电脑后系统作答,不到5秒便导出了文本。

成绩令人惊喜:每道题取三位评分专家的平均分,再计算三道题的平均分,最终机器翻译系统拿下13分。参考往年大学英语六级翻译考题的表现,可达到优秀六级考生的水平。

现场两位评分专家来自上海交通大学外语学院,“这套系统翻译出来的语言质量很高、语法也很地道,表现好过我们得预期让我们惊喜。” 专家给出的评价称:机器翻译能准确表达原文意思、译文流畅、结构清晰,可以较好的辅助不同语言的信息沟通。

自然语言的复杂性成难点

随着以深度学习为代表的第三次人工智能技术的发展,机器翻译取得了长足的进步,在简单应用场景下跨过了应用门槛。

“但到目前为止,机器翻译到底达到了什么样的水平,还没有人能够给出明确答案。”

科大讯飞负责机器翻译的研发人员说,大学英语六级考试正是一种权威客观的衡量方式,“借助于六级中的翻译考题,我们想客观公正地给出当前以汉译英为例的机器翻译技术水平的评估,包括还存在哪些差距。”这样一方面为后续研究提供思路,另方面也可进一步指导机器翻译技术应用。

科大讯飞自2012年启动机器翻译的研发工作,目前已取得不俗的成绩,很多技术也达到世界领先水平。

2014年,在IWSLT口译翻译比赛上就取得了中英互译的第一名;2015年在NIST国际openMT机器翻译比赛,中英人工主观分获得冠军;刚刚过去的2018年IWSLT比赛,在端到端的语音翻译上再次以显著优势取得第一名的成绩。

但机器翻译还是很难,主要是其处理的对象——自然语言存在复杂性。研发人员介绍,自然语言是人类在社会生活中,不断的重复性使用和自然进化,所以同样一句话,在不同的语境中不同人就有不同的理解。

面向领域的神经机器翻译系统

机器翻译系统何以在大学英语翻译权威评测中获得好成绩?

“一是核心算法,二是大规模语料库,三是高性能计算平台。”研究人员介绍,机器翻译技术是利用计算机把一种自然语言翻译成另一种自然语言,从1933年正式被提出开始,目前已发展有三代技术、取得了长足的进步。

最新一代技术是基于端到端的神经机器翻译。而神经机器翻译算法的提出,是当前机器翻译取得重大突破的关键。

大规模平行语料的积累则是基础。目前对于汉语和英语等大语种,业界积累的类似汉语和英语对齐的翻译句对已经达到千万甚至数亿级别,这成为机器翻译学习的语料。

六级翻译题涉及文化、经济、历史、社会等多领域,还有不少专业表达或中国特色词汇,在整个翻译系统可供训练的语料中是比较匮乏的。为了破解这一难题,科大讯飞对神经机器翻译进行若干改进,其中一项重要改进是领域翻译技术,即在通用翻译模型之上进行了领域定制。研发人员在保持原有翻译系统不变的基础上、引入额外的旁支模型,最大程度实现目标领域和其他领域翻译性能的兼顾。

翻译中常会遇到行业术语,有的机器可能没有见过、有的见过却在不同行业有不同翻译方式。讯飞提前将行业领域的关键词汇融入翻译模型,指导机器在平日训练中自动学习术语,从而在翻译过程中产生正确的译文。

基于上述领域翻译技术,科大讯飞推出了面向行业的翻译解决方案,得以在应用领域内“大显身手”。

尽管机器翻译技术已取得大幅进步,由于语言本身的复杂性,机器翻译还有很长的路要走。翻译技术需要人工来帮助机器完成无法处理的问题、更好的解决自身局限,专业翻译人员在翻译过程中积累的语料和知识,反过来也能促进机器进化。这是人机协同的逻辑。

加载更多>>
责任编辑:值班主任
深圳:“全科医生疫苗处方”试点落地&e...