科技日报记者 董韩梓
4月22日,藏语智能全国重点实验室自主研发的智达藏语大模型及系列应用产品在北京发布。该模型基于国产基础架构优化,适配国产AI芯片与分布式推理架构,实现核心环节自主可控。
发布会现场,藏语智能全国重点实验室常务副主任多拉介绍,该大模型打通了图、文、音模态壁垒,适配三大藏语方言自动识别和无缝交互,可精准解析多语混排复杂文档。

研发团队攻克了高精度多语言机器翻译、多方言语音识别合成、复杂场景文字识别等核心技术,构建起打通藏语“听、说、读、写、译”的全模态智能处理体系。“智达AI”系统整合了2024年发布的6款基础应用与全新智能模块,打造“1个核心大模型+8大场景应用”协同软件矩阵,涵盖智达翻译、语音翻译、文字识别、智能图译、AI词典、文献检索、有声听书、智能藏医,同步推出数字播报、字幕转写等产品。
针对藏语低资源、多方言数据处理难题,研发团队搭建了汉藏英多语种大模型底座,建成150GB高质量藏文文本语料库、8700万句对多语言平行语料,3万小时多方言语音数据集,推动现代科学与民族优秀传统文化双向交融。
长期以来,藏语在智能化发展中面临“数据少、算力弱、人才缺”的短板,制约了涉藏地区的智能化进程。青海师范大学党委书记毛学荣介绍,智达藏语大模型具备强大的藏语语义理解与生成能力,同时支持中、英等多语言交互,将为涉藏地区的政务、教育、医疗、文化等领域的智能化发展提供技术支撑。
本次智达藏语大模型发布是青海师范大学、西藏大学、南京邮电大学联合共建的藏语智能全国重点实验室在大模型领域创新成果的集中展示。
中国工程院院士、藏语智能全国重点实验室主任尼玛扎西表示,该系列产品能实现无障碍语言交流,将提升政务服务的便捷性与普惠性。随着模型的不断优化和推广应用,它将成为连接民族地区与外界的“智能桥梁”,为我国涉藏地区的长治久安和高质量发展注入动力。
(青海师范大学供图)

网友评论