3月26日,全球瞩目的2019苹果春季发布会如期而至。网易有道联合网易科技、中关村在线、天极网、太平洋电脑、电脑之家、快科技在内的6家国内顶级科技媒体,为观众提供发布会直播视频的同声传译服务,并借此进行了一次单纯的AI同传试验。

网易有道为这场试验做了哪些准备?AI同传应用了哪些技术,未来发展又将如何?针对以上疑问,我们采访了有道同传项目组的相关工作人员,揭秘此次苹果发布会直播同传背后的故事。

1

今年春节期间,国产科幻电影巨制《流浪地球》引发各界热议。随即,2019年也被大量影迷视作“中国科幻元年”。但科幻未必都离现实太过遥远,影片中能够实时翻译各国语言的人工智能同传系统已经出现。

事实上,网易有道在AI同传领域已经开展了多年研究。2018年,有道AI同传已经服务过多场线下大型会议,为现场观众实时翻译外国嘉宾的演讲内容。有道AI同传已经在线下活动中经受过反复检验,不过这次,应用场景由线下会议变成了苹果发布会直播。

2

北京时间3月26日凌晨1点,一年两度的苹果发布会让Apple Park园区更加热络,史蒂夫·乔布斯剧院人声鼎沸。而在地球的另一端,海淀后厂村网易大厦的灯光依然明晃,紧锣密鼓地为这场全球瞩目的盛会做着最后准备。

“今年苹果发布会不推出硬件产品,而是主打服务,但目前关于苹果服务的信息非常少,我们缺乏相关语料来训练AI,在直播开始前确实有些担心效果。”有道同传项目组的负责人坦言道。

虽然早就传闻此次不会发布硬件产品,但苹果发布会从来不缺少关注。为了给屏幕前的观众带来优质的观看体验,后厂村网易有道的机房里一群人彻夜未眠。从凌晨一点到凌晨四点,有道AI同传项目组的工作人员顶着黑眼圈,实时监控着AI同传的翻译效果。

3

实际上,苹果发布会同传项目的实际开展比想象中困难许多。

即使是人工译员,在接到苹果发布会这样的大型会议同传任务后,也需要至少一周的时间进行准备。尤其是发布会涉及到新品和技术的专业名词翻译,一直是同声传译遇到的最头疼的问题,这也是有道AI同传前期准备最多的地方。

(同传效果展示)

据负责人介绍,有道同传项目分为两大板块:同传内容生成和内容展示。内容生成也就是有道AI同传的核心技术部分,结合ASR语音识别技术和NMT神经网络翻译技术,将直播语料实时翻译成中文;内容展示则负责将AI同传的结果输出,确保观众在观看发布会的时候能够享受到流畅的翻译体验。

苹果官方刚刚放出发布会消息后,网易有道就接到了媒体邀约——希望有道能够为苹果发布会的直播做同传,以便国内观众观看。而此次采用完全不加人工的方式正是网易有道一次单纯的AI同传试验。”

4

在内容生成层面,ASR语音识别技术是AI同传的基础,只有先识别正确才有可能翻译得准确。有道的语音识别模型采用N-GRAM语言模型加TDNN-LFMMI声学模型的方式,这一组合的特点就是又快又准。

有道同传项目组整理了历年苹果发布会的音视频资料,将每一句语料切成单个句子,从超过10万条音频中精选出3万条用以训练ASR模型。此外,有道词典和有道翻译官这两个庞大的语料库也为语音识别技术的训练提供了重要补充。最终,专为此次苹果发布会训练的ASR语音识别模型在短时间内识别质量提升了5个绝对点。

“当时有一个问题一直困扰着我们,我们发现MacBook这个词经常会被识别成math book,但对这个词进行过多训练又会影响语音识别模型的通用性,担心发布会中真的有人提到math这个词。”负责ASR业务的工作人员无奈地笑了笑。不过很快,这个问题通过训练更多的相关语料得以解决。

在翻译方面,2017年4月有道正式推出了自主研发的神经网络翻译技术(YNMT),该技术已经服务于有道词典、有道翻译官、有道翻译王2.0 Pro等多个产品,翻译速度和翻译质量都处于行业头部地位。在此次发布会同传项目中,项目组对神经网络翻译的训练重点在于通过文本规划和动态规划的方法将中英文翻译对齐,以便提供更优质的同传观看体验。

而在内容展示方面,有道同传项目组将原有软件进行了全新定制开发,为增强观众体验,前端显示画面中省略了同传翻译的实时变化,而是直接生成最终的翻译文本,并将每页画面的字幕行数调整至最佳。

在有道看来,同传内容和同传体验同等重要。

5

“项目结束的时候,天都已经亮了。”同传项目组负责人打趣道。

目前,AI同传仍处在发展的初级阶段,有道同传负责人也表示:“我们的目标从来不是让AI取代人工,而是用AI服务人工。我们开展这次AI同传试验,全方位了解到了现阶段AI能力的优势与不足,这为未来的研究打下了基础。”

十多年前,网易有道把词典软件带入互联网时代,颠覆了词典行业。十多年后,期待网易有道运用AI技术,助推同传领域翻开新的篇章。

 

内容源自:中华网