机器之能 X 语言之美
从 1954 年 IBM-701 计算机首次将「Mi pyeryedayem mislyi posryedstvom ryechyi」翻译成「我们通过语音传递思想」,在这六十多年里机器翻译似乎正在一点一点地瓦解语言所形成的国家与国家之间,文化与文化之间的壁垒。本期圆桌,知乎与 Google 翻译共同邀请了几位科学家与语言学家,共话语言和翻译,探讨「 编码 」和「 解码 」过程中的成果、挑战与前景。
9363811 次浏览 1742 人关注
  • 9
    目前机器同传与人工同传的对比其实是很不公平的,因为许多同传任务其实是大体有稿,做过准备的。很多会议同传,在开始前都要先进行一些准备工作,试想如果一个对会议背景一无所知的翻译直接进行同传,肯定要闹笑话。那么机器同传的水平如何呢?一个例子是微…显示全部
    2018-01-05
  • 11
    语言学研究对机器翻译的核心算法(特别是神经网络机器翻译)并没有太多的直接帮助。很多情况下将机器翻译看作相对简单的序列到序列问题会得到更好的结果。集成语言学知识的研究也在开展但是目前看来并没有突破性的(或者说值得集成的)结果。一个完整的机器…显示全部
    2018-01-05
  • 3
    机器翻译都是人为操纵的。首先机器翻译的训练数据归根到底都是人工生成——可能是爬虫爬取,选择哪些数据来进行训练和测试,如何过滤数据等等,都是需要人(或者人编写的算法)来决定。所以纯粹的“数据驱动”其实是不存在的。其次大多线上机器翻译系统都会…显示全部
    2018-01-05
  • 4
    我想从领域发展的进程的角度来回答这个问题,而不是主要着重规则方法和统计的方法的比较. 自然语言处理领域如语言模型,句法分析(parsing),机器翻译有相似的从规则方法转到统计方法的进程,我主要用机器翻译为例。 问题问的“规则方法”应该是指人类自己…显示全部
    2018-01-05
  • 140
    在这里看到这个问题,颇为感怀。于是,在看到问题后,在想自己的经历是否对有这方面需求的朋友有些参考价值,一直踌躇着没有回答,最终决定还是写下来。 我不是专业译员,英语水平也不高,不过使用 OmegaT 至今三年多了,翻译、更新过的内容也马马虎虎的不…显示全部
    2014-02-14
  • 45
    “理解”是一个很空泛的定义,事实上“人类是否能够真正理解人类语言”这个问题都很难回答。举个例子,诘屈聱牙的尚书中有四个字“曰若稽古” (曰若稽古帝尧曰放勋, 尚书 尧典)。到底这是什么意思?是“顺从古代人的意思”,还是“从古籍中查考”?据说有人…显示全部
    2017-12-25
  • 77
    @Cici Zhang 邀。(拖延癌拖了一年多的邀请……)利益相关:做了三年 NLP,主要做过词向量、语言模型和机器翻译;学过两个月阿拉伯语(实在太难,弃疗)、半年西班牙语、半年日语、大半年希伯来语、一年俄语、一年拉丁语,以及一点现代汉语、音韵学、音…显示全部
    2017-10-22
  • 30
    人们常常会用“人机大战”来设想人与机器的关系,要想把这种思维定势转变为“人机合作”并不那么容易,也不会在一夜之间发生。但它确实势在必行,因为人类目前所处的时代中,技术越来越不受物理设备的禁锢,并且越来越普及,成为我们生活中不可缺少的一部分…显示全部
    2017-05-10
  • 218
    我是语言学系出身的,很多人以为自然语言处理的理论基础是语言学,很遗憾这个想法大错特错。当前的理论语言学(theoretical linguistics)主流研究越走越偏,对计算语言学(computational linguistics)/自然语言处理(natural language process)几乎没有任何贡…显示全部
    2017-03-09
  • 192
    基本上大家对神经网络机器翻译的工业化不再有任何疑问。在这一年里几乎所有的主流机器翻译团队都抛弃了早期的统计机器反映方法,全面投入神经网络机器翻译研究。大体上这一年的成果可以分为两部分:基础研究和应用研究。在基础研究上,最令人兴奋的是突破了…显示全部
    2018-01-02
  • 29
    严复说翻译的要求就是信、达、雅。对机器翻译显然也应该如此要求,但是这三点都还存在很大的困难。首先看看这个三个字的涵义。信指的是完整传达信息,不增不减。达指的是语句通顺,不拘泥于原文。雅则要求词语得体,风格统一且切合原文。“信”和“达”大体…显示全部
    2018-01-01
  • 281
    我在CMU开始学做机器翻译的时候,正是基于规则的机器翻译即将退出历史舞台的时刻。当时我选了两门语言学的课程(都是Lori Levin的课),并且生生用LISP手写了一个基于生成语法的机器翻译系统。然而在课堂上我发现,语言学往往在面对真实世界的语言时只能采…显示全部
    2017-12-25
  • 30
    前面有回答提到语气、情感、情绪方面的问题,且不说这些语义因素。就说普通的准确率问题,人工智能在翻译上还和专业的人脑译者有很大的差距,这个差距在商务、商业、学科专业方面的翻译上可能相对小一些,但是在人文社科类例如文学著作的翻译方面差距就非常…显示全部
    2018-01-01
  • 339
    自然语言处理有一套严整的理论体系,如果希望系统学习可以参考Stanford NLP Group几位教授的三本教科书,基本都有中文翻译版本。以下按照我心目中的浅易程度排序: Christopher D. Manning, Prabhakar Raghavan, and Hinrich Schütze. 2008.Introduction t…显示全部
    2015-10-08
  • 28
    人工智能有很多很多的模型/方法来实现,我这里主要谈谈在深度学习下,特别是在编/解码器架构下,机器理解自然语言的原理。深度学习理解自然语言是通过编码器(Encoder)来实现的。对于自然语言的句子,机器并没有办法直接理解它的意思,我们需要用编码器把…显示全部
    2017-12-25