科技日报记者 都芃
9月17日,第22届中国—东盟博览会(以下简称东博会)在广西南宁开幕。作为第22届中国—东盟博览会多语言翻译服务暨人工智能特别合作伙伴,科大讯飞以AI助力这场国际经贸盛会实现“全场景无障碍沟通”,提供七种语言AI同传、数字人司仪、实时会议纪要等多种强大AI能力。
开幕式上,当嘉宾发言时,会场巨型LED屏幕上实时跳动着中文、英语、越南语、泰语、缅甸语、马来语、印尼语等七种语言的翻译字幕。这是七语言实时同传首次亮相国际展会。
这背后是讯飞同传技术的强大支撑。讯飞同传是科大讯飞针对国际跨语言交流打造的系统解决方案,集成了实时机器转写翻译、AI字幕投屏、多语言语音合成播报等多项核心功能,广泛应用于国际会议、教学培训、文化传播等多个场景。自推出以来,已覆盖全球50多个国家和地区,累计保障超过42万场会议,服务观众总数突破4亿人次。
科大讯飞副总裁、听见科技总经理王玮介绍,本次东博会的多语言实时字幕服务主要依靠两个核心引擎:中英翻译部分,采用的是此前已发展成熟的星火语音同传大模型,该模型已涵盖金融、医疗等垂直领域超8万个专业词汇;针对东盟语言的翻译部分,则是团队针对东盟语言的语法、文化语境以及专业术语等方面进行专项优化,以提升翻译的准确性和适配性。此外,在字幕呈现方式上,团队针对东博会特定需求,创新设计了窄长条形、瀑布流式的新样式。
开幕式上,科大讯飞打造的两位数字人司仪也成为全场焦点,这也是东博会首次在开幕式中使用数字人技术。讯飞智作团队为其精心设计了四套造型。男性数字人CC代表中国,身着白色西装与金色祥云唐装两套造型,兼具现代与传统风格;女性数字人AA代表东盟,有马来西亚经典配色的娘惹服和缅甸特色花纹华丽服饰两套造型,细腻呈现东盟文化特色。
讯飞智作是科大讯飞打造的AIGC数字人音视频内容创作平台,集成了数字人定制、多语言及方言的语音合成以及数字人视频制作等核心功能,并搭载了2024年科大讯飞率先发布的超拟人数字人技术,仅需一张照片就能构建数字人,口型、表情、动作均由大模型自动生成,能够精准匹配文本的意图,进一步降低了数字人的应用门槛。目前,讯飞智作的数字人已广泛应用于教育、媒体、金融、政务、医疗等场景。
据了解,科大讯飞还将在东博会期间发布面向东盟的星火东盟多语言大模型底座以及讯飞翻译SaaS(软件运营服务)平台、讯飞听见多语言会议系统(东盟版)、科大讯飞中文智慧教学系统(东盟版)等产品,并针对东盟语言升级讯飞双屏翻译机2.0。
(受访单位供图)