新版 Google 翻译好不好用?我们借“李白”测试了一下

百家 作者:爱范儿 2018-06-14 13:33:31


去年 3 月,Google 翻译成为我们目前在国内可以正常使用的 Google 应用。现在这个 app 又有新变化,要变得更好用了。


近日 Google 宣布,将在 iOS 以及 Android 的 Google 翻译软件上加入离线神经网络机器翻译(NMT,Neural Machine Translation),也就是说,下载了离线的资源包后,在没有网络的情况先下,Google 翻译也会说人话啦,而不是逐个词语地生硬翻译。


这次 Google 翻译提供了包括中文在内 59 种语言的离线翻译包。我们选择下载了中文翻译离线包,同时找了一些英文语段,试了在联网以及离线的情况下,翻译有哪些变化。



加入了 NMT 的 Google 翻译,真的变聪明了吗?


不知道你之前是否发现,在联网和离线的情况下,用 Google 翻译出来语句是有差异的?那是因为在不同的平台,Google 使用了不同的翻译技术。


因此我让 Google 翻译分别在联网、离线没有 NMT、离线拥有 NMT 的三种情况,对古诗词、新闻报道、经典台词以及日常用语,进行了四个回合的翻译能力对比。从信达雅的角度进行打分,满分为 5 分。


同时将它们翻译出来的内容,放在网页版的 Google 翻译中,看是否能够还原翻译前的意思。


第一回合:翻译李白的一句古诗


比如我找到了李白《将进酒》中的这一句用来翻译:「君不见,黄河之水天上来,奔流到海不复回。」


▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT


联网时的翻译是:



Do not you see, the waters of the Yellow River come to heaven, running to the sea will not return.

点评:满分 5 分,得分为 4 分。因为意思相对完整,「黄河」的翻译首字母都用上了大写,真是细致,基本没有语法错误,还相对浅显易懂。


没有更新 NMT 前的离线翻译是:



Do not you see, yellow River water heaven, torrent to sea not re-back.

点评:真的是逐字翻译,语法错误明显。 2 分。


更新 NMT 后的离线翻译是:



Junski, the yellow river on the day, run to the sea is not replicated.

点评:Google 翻译的人工智能,把「君不见」识别为一个人名,并且翻译成了「Junski」。语法错误明显,曲解诗句原意。1.5 分。


这一回合,只有联网时的翻译可以还原以前的意思。


第二回合:翻译新华社的一段新闻


我找到了新华社 6 月 14 日,一篇题目为《5 月份主要数据反映中国经济运行稳健》的第一段:「国家统计局 14 日发布的数据显示,5 月份,国民经济继续保持总体平稳、稳中向好发展态势,生产需求基本平稳,就业持续向好。」


▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT


联网时的翻译是:基本没有语法错误。5 分。


没有更新 NMT 前的离线翻译是:逐字翻译无疑,「14 日」翻译有误,语法错误明显。 2 分。


更新 NMT 后的离线翻译是:「五月份」这个翻译有误,离线情况下也有使用句子的方式来翻译。3 分。


▲ 使用离线 NMT 翻译的语句,第一个分句在还原时有误


这一回合,最后在网页版的 Google 翻译中,对这三段英文译文进行还原时,前两个都能还原出句子原来的意思,但是使用离线 NMT 翻译的语句,第一个分句并不能被网页版的 Google 翻译正确还原。


第三回合:翻译一句简单的美剧台词


《神探夏洛克》第一季第一集里,有一句经典的台词:「You, don't talk out loud. You lower the IQ of the whole street. You, face the other way. You are putting me off. 」


▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT


联网时的翻译是:



你,不要大声说话。你降低了整条街道的智商。你,面对另一种方式。你让我失望。

点评:4 分。结构整齐,但有一个分句翻译出错。


没有更新 NMT 前的离线翻译是:



你,不说话出声来。您降低 iq 的整个街。你,脸的其他方式。你是把我关闭。

点评:1 分。这一句的翻译,简直是拉低了 Google 的智商。


更新 NMT 后的离线翻译是:



你不要喊出大声。 你降低整个街道的智商。 你面对另一方面。 你把我放在了。

点评: 2 分。前半部分翻译正确。但是后一部分就不行了,最后话说到一半就结束了,你想学习人类的欲言又止吗?



这一回合的结论是,在不联网的情况下,Google 翻译都拉低了 Google AI 的智商。


第四回合:翻译一句生活日常用语


「游泳健身,了解一下。」


▲ 从左往右分别是:联网,离线未更新 NMT,离线使用 NMT


联网时的翻译是:



Swim up and learn about it .

没有更新 NMT 前的离线翻译是:



Swimming fitness, look.


更新 NMT 后的离线翻译是:



Swimming fitness and understands.

这一回合,联网时的翻译罕见地出现了较大的偏差。在网页版 Google 翻译上还原的时候,只有第二种情况,没有更新 NMT 的离线翻译能够准确还原。


总结


总而言之,Google 翻译作为一种工具,为我们平常的生活、学习提供了很大的便利。离线情况下,就算加入了 NMT,解决了逐字翻译的问题,用句子的方式来表达,但依然距离信达雅还有一定的距离。


联网的 Google 翻译,准确度依然是比较高的。还有就是,我们依然需要努力学习英文,不能太过依赖机器的翻译,因为它们依然还没有到达非常可靠的程度。


AlphaGo 神经网络早在两年前开始应用于 Google 翻译,人工智能对人类语言识别依然在快速发展。对于目前手机的性能而言,将人工智能装进移动设备,无论是硬件还是软件,挑战还是蛮大的。


这次 Google 将深度学习的模型压缩到了普通智能手机可以承受的范围内,我们这次发现,每种语言的离线压缩包,大小都在 40-50 MB 左右。



关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接