科技日报记者 都芃
9月17日—21日,第22届中国—东盟博览会(简称东博会)在广西南宁举办。本届东博会上,跨文化交流成为各界热议的话题。其中,短剧作为当下全球走红的文化产品之一,被各界嘉宾反复提及。
今年以来,东南亚短剧市场发展迅速,是全球短剧用户增长最快的地区之一。相关机构调研报告显示,2025年第一季度,东南亚短剧App下载量环比上涨61%,达到约8700万次,占全球短剧App下载量的30%。2025年上半年,东南亚地区的短剧应用内购收入跻身全球前三,对全球市场贡献率超过10%,成为涨幅最高的区域。
迅速攀升的用户规模,不断做大的市场“蛋糕”,加之地域文化相近、华人受众基础雄厚,东南亚也成为中国短剧企业重点发力的海外市场之一。
短剧内容迭代更新快,制作周期短,效率是短剧产业的生命。在短剧出海中,许多制作企业、短剧平台创新采用AI翻译、AI配音等技术,实现一部剧快速适配多国语言、多地风格,提升本土化效率,助力本地化传播。适应东南亚地区多样语言体系、丰富本土文化的多语种智能技术在这一过程中变得至关重要。
本届东博会首次设立人工智能专馆,吸引近百家国内外人工智能企业参展。其中,中国人工智能企业科大讯飞专门面向东盟市场推出了星火东盟多语言大模型。该模型基于完全国产化软硬件打造,针对马来语、泰语等东盟十国语言进行了专项优化,具备语言理解、机器翻译等多元能力。依托这一底座,讯飞译制平台近期上线了马来语、越南语、泰语等东南亚语种的相关功能。
讯飞译制相关负责人告诉记者,讯飞译制是一款集成音视频字幕识别、多语种字幕翻译、多语种高拟化配音等功能的智能化平台,可以为传媒公司、内容创作者和企业用户提供一站式多语种音视频制作解决方案。依托科大讯飞的语言转写、机器翻译、语音合成等关键技术,讯飞译制通过高精度语音识别和机器翻译生成多语种字幕,同时支持多语种、多情绪、多声线智能配音,实现一站式多语种音视频内容制作,解决跨语言传播的难题。
例如,讯飞译制的“智能译制”功能可以将视频中的人物语音快速转写,生成双语字幕,支持包括多种东南亚常用语种在内的17种语言。其还可以一键实现目标语言配音,提供AI主播配音和声纹克隆配音两种模式,为短剧制作者提供接近母语配音的效果。同时,该功能下生成的每一条翻译字幕都可以借助AI进行风格改写。例如,用户可以要求其“用更严肃的语气翻译”,生成结果可以直接替换原有翻译字幕。“平台可以做到字幕生成、翻译、配音一步到位,特别适合短剧、多语种课程等跨文化产品应用。”上述负责人介绍。
东南亚地区语言多样,训练语料匮乏,要对当地的多种语言进行准确的AI翻译和语音合成并不容易。例如,语音模型需要依托大规模标注数据才能进行有效学习,但东南亚部分语言拥有复杂的辅音丛和元音组合,并且声调复杂,对语音识别要求高,即使微小误差也可能导致语义完全偏离。此外,部分东南亚语言如越南语,存在复杂的一词多义现象,必须依靠具体的上下文才能实现歧义化解。
面对一系列技术难关,今年初,科大讯飞研究院便已着手攻关多语言文本翻译大模型。面向本届东博会,团队将涉及的东盟国家语言从原有多语言计划中重点拎出,针对相关语言的语法、文化语境以及专业术语进行了专项优化。
突破的背后,是科大讯飞在智能语音技术领域的深厚积淀。去年,科大讯飞作为第一完成单位的“多语言智能语音关键技术及产业化”项目获得国家科学技术进步奖一等奖,该项目在多语言语音识别、语音合成、翻译等方面取得重大突破。进入大模型时代后,科大讯飞打造出首个基于全国产算力平台训练的深度推理大模型——讯飞星火X1,并以此为底座,打造星火语音同传大模型,在翻译效果、实时响应、语音听感、专业精深领域深度等四大维度展现出良好效果。
跨文化传播并非简单的语言翻译,优质的跨文化产品只有实现与当地文化深度融合,才能真正引起跨国界受众的共鸣。
面向内容行业需求,科大讯飞已与马来西亚广播电视台携手,围绕人工智能技术在影视译制、实时字幕生成及智能影视创作等领域的深度应用展开合作;同时,联合中国外文局、湖南省委宣传部、湖南师范大学共建“马栏山译制中心”,以多语言大模型为底座,打造覆盖图文、视频、新媒体等多模态内容形态的国际传播能力集群。
(受访者供图)