突破小语种机器翻译,阿里获WMT国际大赛5项冠军

2018-05-25 09:29:37 来源: 环球网 作者:

突破小语种机器翻译,阿里获WMT国际大赛5项冠军

在刚刚结束的WMT2018国际机器翻译大赛上,阿里巴巴达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构,在所有提交的5项比赛中,全数获得冠军,成为此次比赛的最大赢家。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译,达摩院在这几个项目的自动评测指标BLEU都位居第一。

图为达摩院获得5个项目自动评测第一名。

WMT全称Workshop on Machine Translation,是国际公认的顶级机器翻译赛事之一,也是各大科技公司与学术机构展示自身机器翻译实力的平台。2018年更吸引了包括翰霍普金斯大学、爱丁堡大学、亚琛工业大学、马里兰大学、微软、腾讯等几十个海内外团队参与。

由达摩院机器智能技术实验室资深算法专家陈博兴博士带领的达摩院机器翻译团队,在此次比赛中,基于业界最新的Transformer结构,进行了网络结构的改进和对词语位置信息的充分利用,全面改进了机器翻译的性能。同时充分利用阿里的计算资源优势,训练数据和模型的规模都达到了行业最高纪录。陈博兴博士是国际权威的机器翻译专家,曾任加拿大国家研究委员会研究员,担任过NLP领域所有顶级会议和期刊的审稿人,并曾多次在各类机器翻译评测中取得优异成绩。

图为达摩院机器智能实验室资深算法专家陈博兴博士。

此次达摩院不仅在竞争最激烈的英中翻译上继续保持优势,值得一提的是,阿里还将机器翻译的技术优势延伸至俄语、土耳其语等多个语种。以往这些语言的机器翻译技术,都由谷歌等国外公司与研究机构保持领先。

据透露,阿里巴巴的电商机器翻译总量已经达到每日7.5亿次。对于阿里的国际化发展而言,“语言”是一大门槛。以阿里巴巴国际站为例,七成买家以英语沟通,还有30%为小语种。而卖家端的调研数据显示,大约96%的卖家对小语种无能为力。这一现状,也催生了对机器翻译的巨大需求。

阿里达摩院机器智能实验室NLP首席科学家司罗表示:“机器翻译的发展无法脱离用户与场景,阿里机器翻译的不断进步,得益于在电商、新零售、物流等领域积累的丰富场景和数据。特别是在俄语、土耳其语、西班牙语的探索上,让我们看到了机器翻译的巨大商业价值与应用潜力。”

阿里的机器翻译技术除了应用于电商全链路服务之外,还广泛应用于菜鸟物流通关、阿里云国际社区、飞猪旅行翻译助手、钉钉社交口语翻译等一系列产品。

责任编辑: 夏青