2018年国际口语机器翻译评测比赛IWSLT中夺冠
在近日刚结束的2018年国际口语机器翻译评测比赛(International Workshop on Spoken Language Translation,简称IWSLT)中,科大讯飞以在英德方向语音翻译任务上端到端模型(End-to-End Model)显著优势获得第一,基线模型(Baseline Model)获得第二的优异成绩,充分证明了自身在语音翻译领域的国际领先地位。
IWSLT是国际上最具影响力的口语机器翻译评测比赛,每年举办一次,至今已经举办了15届。IWSLT 2018 吸引了世界各地多所机器翻译领域的知名大学及研究所参加,包括英国爱丁堡大学(University of Edinburgh)、美国约翰霍普金斯大学(JHU)、德国卡尔斯鲁厄理工学院(KIT)、意大利Bruno Kessler 基金会(FBK)、芬兰赫尔辛基大学(Helsinki),以及国内的阿里巴巴、搜狗等。

本次比赛包括两个主要任务,一是语音翻译任务,评测数据来自英语到德语的TED演讲真实语音和文本;二是低资源文本翻译任务,数据来自巴斯克语到英语的TED演讲真实文本。科大讯飞结合公司当前讯飞翻译机2.0、讯飞输入法、讯飞听见等产品应用场景,参加了语音翻译任务评测。
语音翻译目前主要有两种实现方式,一是传统基线模型(Baseline Model)方案,对输入语音先进行语音识别得到文本结果,然后再进行文本机器翻译,实际应用中由于复杂环境下语音识别错误的存在,导致误差扩散影响最终语音翻译性能;二是采用最新提出的端到端模型(End-to-End Model)方案,基于神经网络强大的建模能力,输入语音直接输出目标译文。本次语音翻译评测任务,主办方对两项技术分别进行了评测。

科大讯飞基于语音识别和机器翻译上的深厚积累,将最新深度学习研究成果成功应用于语音翻译任务,不仅在传统基线模型上获得第二名的成绩,同时通过核心源头技术创新在最新的端到端模型上勇获第一。这是在科大讯飞继2014年IWSLT中英翻译取得冠军以来,再次在此项比赛中获得重大突破,充分证明了公司在语音翻译领域的国际领先地位。