科技日报记者 吴长锋
12月8日,安徽声云智能科技有限公司(以下简称声云智能)正式对外发布了其“智能办公多语种识别与角色分离技术”。声云智能首席科学家洪青阳教授对外表示,此举正是公司积极响应“人工智能+”行动,将人工智能语音技术转化为赋能实体经济的一系列技术实践。

“涉外商务谈判、国际性会议、跨语种客户服务……许多场景都需要跨语种翻译技术作为支撑。比如,针对会议、访谈等复杂场景,需要区分不同说话人。环境噪声干扰、语音交叠、说话人数未知等多重挑战,角色分离曾是行业公认的技术难题。”洪青阳告诉记者,公司研发团队历经多年持续攻关,先后完成了三轮核心算法的迭代,不仅有效提升了分离精度,更实现了运行效率的显著提升,达成了精度与效率的较优平衡。“在攻克多语种识别这一关键技术上,声云智能研发团队针对性地开展小语种微调训练,成功构建高效的流式识别模型,不仅实现了高质量的实时语音转写,更拓展了同声传译等高级功能。”洪青阳表示,面向蓬勃发展的智能办公场景,声云语音技术通过持续快速迭代,为AI鼠标、智能录音笔等硬件产品的创新提供了坚实的技术底座,从而为智能会议系统、媒体生产、司法庭审等众多场景提供了可靠的技术支持。
据介绍,目前该技术已覆盖欧洲、东南亚等全球多个地区的超100种语言,显著提升了跨语言沟通与信息处理的效率。
(受访者供图)

网友评论