机器之能 X 语言之美
从 1954 年 IBM-701 计算机首次将「Mi pyeryedayem mislyi posryedstvom ryechyi」翻译成「我们通过语音传递思想」,在这六十多年里机器翻译似乎正在一点一点地瓦解语言所形成的国家与国家之间,文化与文化之间的壁垒。本期圆桌,知乎与 Google 翻译共同邀请了几位科学家与语言学家,共话语言和翻译,探讨「 编码 」和「 解码 」过程中的成果、挑战与前景。
12334300 次浏览 1773 人关注
  • 17
    目前机器同传与人工同传的对比其实是很不公平的,因为许多同传任务其实是大体有稿,做过准备的。很多会议同传,在开始前都要先进行一些准备工作,试想如果一个对会议背景一无所知的翻译直接进行同传,肯定要闹笑话。那么机器同传的水平如何呢?一个例子是微…显示全部
    2018-01-05
  • 14
    语言学研究对机器翻译的核心算法(特别是神经网络机器翻译)并没有太多的直接帮助。很多情况下将机器翻译看作相对简单的序列到序列问题会得到更好的结果。集成语言学知识的研究也在开展但是目前看来并没有突破性的(或者说值得集成的)结果。一个完整的机器…显示全部
    2018-01-05
  • 4
    机器翻译都是人为操纵的。首先机器翻译的训练数据归根到底都是人工生成——可能是爬虫爬取,选择哪些数据来进行训练和测试,如何过滤数据等等,都是需要人(或者人编写的算法)来决定。所以纯粹的“数据驱动”其实是不存在的。其次大多线上机器翻译系统都会…显示全部
    2018-01-05
  • 54
    “理解”是一个很空泛的定义,事实上“人类是否能够真正理解人类语言”这个问题都很难回答。举个例子,诘屈聱牙的尚书中有四个字“曰若稽古” (曰若稽古帝尧曰放勋, 尚书 尧典)。到底这是什么意思?是“顺从古代人的意思”,还是“从古籍中查考”?据说有人…显示全部
    2017-12-25
  • 203
    基本上大家对神经网络机器翻译的工业化不再有任何疑问。在这一年里几乎所有的主流机器翻译团队都抛弃了早期的统计机器反映方法,全面投入神经网络机器翻译研究。大体上这一年的成果可以分为两部分:基础研究和应用研究。在基础研究上,最令人兴奋的是突破了…显示全部
    2018-01-02
  • 291
    我在CMU开始学做机器翻译的时候,正是基于规则的机器翻译即将退出历史舞台的时刻。当时我选了两门语言学的课程(都是Lori Levin的课),并且生生用LISP手写了一个基于生成语法的机器翻译系统。然而在课堂上我发现,语言学往往在面对真实世界的语言时只能采…显示全部
    2017-12-25
  • 30
    严复说翻译的要求就是信、达、雅。对机器翻译显然也应该如此要求,但是这三点都还存在很大的困难。首先看看这个三个字的涵义。信指的是完整传达信息,不增不减。达指的是语句通顺,不拘泥于原文。雅则要求词语得体,风格统一且切合原文。“信”和“达”大体…显示全部
    2018-01-01
  • 18
    已经有几个关于如何入门的回答,补充一下这三者的关系。数据挖掘和机器学习都是基于数据的科学。数据挖掘侧重于从数据中获取知识来供人类决策。知识来自与数据,结果往往是抽象的知识,大多数情况下并不直接进行决策。这是其主要特征。例如我们可以从大量春…显示全部
    2017-12-23
  • 14
    机器翻译是自然语言处理任务,从诞生起,当然就会与语言学紧密联系。语言学和机器翻译很多情况下是共同发展的,人类对语言的认识也是逐渐深入,今天的语言学与60年前也大不相同。五十年代的机器翻译大跃进和盲目乐观与当年语言学对机器翻译难度的认识缺乏也…显示全部
    2017-12-29
  • 17
    “机器翻译”是一个相对模糊的概念,大体上所有利用机器帮助人类进行翻译活动的技术和服务都可以归类为机器翻译。例如在线词典、翻译套件等,在广义上也可以称为机器翻译。现在绝大多数情况下,机器翻译指的是利用机器(电脑)进行完整的句子或篇章翻译的系…显示全部
    2017-12-28