机器翻译技术的进展已经或将要对人工翻译市场带来什么样的影响?

最新进展:微软2018年3月14日,宣布其研发的机器翻译系统首次在通用新闻翻译的汉译英达到了人类专业水平,超越业余译者,实现了自然语言处理里程碑突破。
关注者
468
被浏览
47,809
收录于知乎圆桌 ·

人们常常会用“人机大战”来设想人与机器的关系,要想把这种思维定势转变为“人机合作”并不那么容易,也不会在一夜之间发生。但它确实势在必行,因为人类目前所处的时代中,技术越来越不受物理设备的禁锢,并且越来越普及,成为我们生活中不可缺少的一部分。


“人工智能就像一个守护天使,它时刻关照着你。” 当下,机器翻译已经能减少部分情况下的人工翻译。微软将这种无处不在而又似乎“无处可寻”的技术理念称为“隐形革命”。随着机器学习等人工智能技术的发展,获得与使用数据的增多,机器将越来越善于从事某些工作。人工智能的最终目的是帮助人类拥有更好的生活,未来将是人类智能与人工智能的共同组合。


————这里是正式回答的分割线————


在机器翻译方面,微软正将这一技术服务到日常生活当中。



在去年12月1日的微软技术大会上,微软认知服务与花椒直播共同展示了展示了使用微软人工智能翻译技术实现多语言直播的应用。人称“哈利波特”的微软亚洲研究院首席研究员 Thomas Moscibroda博士用他的母语——德语在直播期间回答了网友们用中文提出的各种好玩的问题。网红主播Thomas说的话和网友的问题都实时显示中德双语字幕,这背后则是有微软提供的Microsoft Translator的语音翻译服务。


Microsoft Translator提供了丰富多样的使用场景,解决了用户在面对面时由于语言不通而导致交流不畅的痛点。例如帮助身处异国的旅行者更方便地与酒店前台、出租车司机和博物馆导游等进行交流。教师也可借助该项技术与只会说其他语言的学生家长进行沟通。在纽约市的一个试点项目中,这项技术还被用于帮助非英语人群申请由州政府颁发的身份证。



积累了微软20多年研究成果,Microsoft Translator的语音翻译服务,现已全部由业界先进的深度神经网络技术驱动,以提供更准确自然的翻译体验。Microsoft Translator语音翻译能实现包括中文在内的9种不同语言之间的实时语音翻译。消费者可以通过实时语音翻译Skype Translator以及Microsoft Translator的iOS和Android版的移动应用进行体验。微软翻译还支持近60种语言的文本翻译。而且这个数量还在不断增加。目前全球已有数千间企业在使用微软自动翻译技术,提高业务效率和服务质量。


微软研究院Microsoft Translator产品战略总监Olivier Fontana说:“我们的终极目标是打破语言障碍。”这项技术适用于一对一交谈(例如旅行者向酒店前台问询)、一对多互动(例如一名导游与一群游客交谈)以及多对多沟通(例如多语言的商务会议和学术讨论)。只需要每个人在手机上打开Microsoft Translator移动端的App,扫描二维码并进入聊天界面,就可以开始交流了。


个人通用翻译器


这一功能以Microsoft Translator语音翻译技术为基础,该技术已先用于Skype Translator,后者让使用不同语言的人群能在网上进行实时交流。


“Skype Translator能让被地区和语言阻隔的人顺畅交流,“但它不能满足面对面交谈的需求,”微软人工智能及微软研究事业部机器翻译组研究经理Arul Menezes说。他和他的同事们都认为, 面对面跨语种交流所要用到的技术,应该更接近于《星际迷航》和其他科幻作品中随处可见的“通用翻译器”。


对于“个人通用翻译器”,团队决定利用业已广泛采用的移动设备,而不再开发专用的翻译硬件。Microsoft Translator团队项目经理Tanvi Surti说:“眼下,智能手机随处可见,几乎人手一只。”Surti负责领导Microsoft Translator现场翻译功能的开发。


该团队开发了一项技术,让现有的Microsoft Translator 手机应用与网站形成了一个整体。“我们花了很多时间思考用户体验设计,”Surti说。“比如我们俩说着两种不同的语言,我们如何做到快速对接以便有更多的时间和注意力用于考虑交谈内容?”


新功能使用起来非常简单。首先,用户通过手机端应用或网站登录这项服务,选择自己的语言并发起新会话。这一过程将生成一个代码以及一个二维码,其他参与者可以输入这代码或扫描二维码加入,然后选择自己的语言,谈话就可以开始了。



交谈一方在发言时要按下键盘空格键或屏幕上的虚拟按钮,就像使用对讲机一样。几秒钟后,他们所说话语的翻译文本就出现在其他对话参与者的设备屏幕上,当然是以其各自的母语呈现。对于部分语言,系统还提供有声的语音翻译。


与大多数尖端前沿技术类似,它目前还不够完美。


“毫无疑问,目前该技术的应用在质量和设置上都有很多提升的空间。但毫无疑问的是,一旦你完成设置,就能在多人使用多种语言面对面交谈的过程中获得‘通用翻译器’体验,”Fontana说。


深层神经网络


机器翻译技术本身是由运行在云中的算法所驱动的,通过使用基于深层神经网络的翻译技术,与先前所谓的“统计型机器翻译”相比,它能够提供更流畅、听起来更有“人味”的翻译。


两种方法都涉及根据早前经专业人士翻译的文档文本数据对算法进行训练,以便让系统了解一种语言中的单词和短语如何用另一种语言来表达。然而,统计型方法局限在由一两个邻近词语形成的上下文范围内对某个单词进行翻译,这可能会导致翻译出来的语句笨拙而迂回。


“神经网络”受到了掌握多门语言的人类在翻译过程中大脑中发生的模式识别过程的启发,实现了更自然的语音翻译。


例如,在非神经世界中,“一群猫”和“一只猫”被视为不同的实体;而人类大脑以及神经网络则把这两者视为密切相关的词。神经网络也可以解析“住宿”和“星宿”两个词中“宿”字的含义区别。Menezes解释说:“单词已经不再被视为它所代表的事物,而是一个包含500个维度的向量,其本质是500组数字,而每一个数字都反映了这个单词的某一个方面。”


神经网络在开始翻译之前,首先用1000个维度的向量对每个单词在整个句子语境下的含义进行建模,无论这句话有5个词还是20个词都是这样处理的。这一包含1000个维度的模型(而非单词)随后被翻译成另一种语言。


此外,Fontana表示,随着该技术被使用的次数越多,翻译的质量也会不断提高。他希望看到Microsoft Translator能被包括旅行者、导游、教师和社会工作者在内的广泛的用户群体所采用。


————这里是回答结束的分割线————


以上回答摘选自微软研究院AI头条,Microsoft Translator:消除面对面交流的语言障碍

感谢大家的阅读。

本账号为微软亚洲研究院的官方知乎账号。本账号立足于计算机领域,特别是人工智能相关的前沿研究,旨在为人工智能的相关研究提供范例,从专业的角度促进公众对人工智能的理解,并为研究人员提供讨论和参与的开放平台,从而共建计算机领域的未来。

微软亚洲研究院的每一位专家都是我们的智囊团,你在这个账号可以阅读到来自计算机科学领域各个不同方向的专家们的见解。请大家不要吝惜手里的“邀请”,让我们在分享中共同进步。

也欢迎大家关注我们的微博和微信账号,了解更多我们研究。