机器之能 X 语言之美
从 1954 年 IBM-701 计算机首次将「Mi pyeryedayem mislyi posryedstvom ryechyi」翻译成「我们通过语音传递思想」,在这六十多年里机器翻译似乎正在一点一点地瓦解语言所形成的国家与国家之间,文化与文化之间的壁垒。本期圆桌,知乎与 Google 翻译共同邀请了几位科学家与语言学家,共话语言和翻译,探讨「 编码 」和「 解码 」过程中的成果、挑战与前景。
9369800 次浏览 1744 人关注
姝姝

1898 年,严复在《天演论•译例言》中,第一次提出了「信达雅」的翻译标准指译文要忠实于原文,不拘泥于原文形式,准确表达原文意思,追求原文意境。不知道你对翻译和语言有着怎样的理解,又对机器翻译有着怎样的期待?

欢迎参与本期圆桌,了解翻译 X 语言的最新进展。可以在讨论区提问,也可以直接在站内提问同时绑定「 机器翻译 」话题,这样你的问题就有机会进入圆桌,期待参与。

2017-12-26
杜兵
目前神经机器翻译比较不错的入门教材:
Philipp Koehn,Neural Machine Translation,还在写,是草稿
Philipp Koehn, Statistical Machine Translation,统计机器翻译,可以了解以前的方法
Graham Neubig,Neural Machine Translation and Sequence-to-Sequence Models---A Tutorial
Yoav Goldberg,Neural Network Methods for Natural Language Processing,自然语言的各个方面
2017-12-27
视界云
人工智能,人为主导,机器为辅,发挥好人的价值才有可能更好的释放机器的能量!
2017-12-28
老汉
目前人工智能还不能称为真正的智能,但是能极大地减轻人的工作负担,这是人工智能存在的根本意义。学术论文等正式文献,人工智能翻译是有很大优势的,因为语法和单词是有限的。但是涉及到文学和新闻等,包含一些口语俚语的,涉及到地方文化民族文化等太多,不是一个机器能够准确完成的。更有甚者,各地都有某些词的意思是可意会不可言传的,要用文字来解释,总感觉差了那么一点点,这种意境,永远是机器无法企及的。
2017-12-28
村支书
@村支书
2017-12-28
迷人的二表
2017-12-28
何周
任何翻译都基于对原文的理解前提,然后在此基础上用目标语言把对象表述出来。由于语言特有的情景化特质,以及它很强的排他性约定俗成特点,这就限制了人工智能的功能。很多时候,一句话甚至一个单词,都需要放到对象的环境中去找出出现的原因,才能选择合适的目标语言来表达。因此,我相信人工智能能在大多数算法环境下替代甚至超越人类,例如棋类;但不可能在语言这类充斥着大量情景化效应的对象上完全取代人类。因此,相信人工智能能帮助人加速完成理解过程,却无法完全取代人类去完成目标语言的组成。
2017-12-28
迷人的二表
@村支书 来看看
2017-12-29
元典法律大数据
说一点特别的机器翻译,在AI+法律领域,我们有一个特别的翻译,即【将生活语言翻译为法言法语】。举个简单的例子,日常生活中我们可以说被公司开了或者被炒鱿鱼了,但用法言法语表述就成为【用人单位与职工单方解除劳动合同】。这就是生活语言与法言法语之间的差别。对于这种转化,我们采用的方式和机器翻译相同,也是通过数据标注建立数据之间的对应模型,而后形成生活语言转化法言法语。
2017-12-29
姝姝 回复 杜兵
感谢推荐!有兴趣欢迎来答题。
2017-12-29
xx小小xx
是不是应该先讨论一下,怎么让墙里面的人也能用Google?
2017-12-29
吴佩孚 回复 何周
可以通过给词定性进行分组啊,减少词意选择范围.
2017-12-30
何周 回复 吴佩孚

给词定性分组当然可以减少词意的选择范围,但翻译,尤其是文学语言翻译,恰恰是做加法。作为一种表征语言,需要被情景化,而情景化涉及到了很多很难加以量化的因素。比如同义词之类。最典型的应该是“风格”。机器翻译的结果基本都是同一化的,但真实的文本语言却不是,并且文学语言最突出的特点就是风格的差异化。这样说吧,我觉得机器翻译是在做减法,是在取差异,把语言抹平。这有点像是手工作品与机械化产品之间的差异。

2018-01-15
取消