什么是deepl,deepl究竟靠谱吗?

营销圈公众号引导关注

如今,又一个新的挑战者高调加入进来,直接把矛头指向堪称行业技术标杆的谷歌、微软以及Facebook。什么是deepl,deepl究竟靠谱吗?

上周,来自德国的DeepL翻译上线,号称实现了NMT技术的新突破,打造出了“世界上最精确、语言组织最自然的机器翻译系统”;并宣布在自家组织的盲测中,打败了谷歌翻译以及微软与Facebook的NMT系统,衅意十足。

目前,DeepL翻译已支持英德法西等42门欧洲语言,正在对汉、日、俄等语言进行训练,并计划在将来发布一款API,让开发者能够将DeepL翻译整合入其应用中。

公司前身

首先要说,这家公司的来历并不简单。

公司的前身是运营已近十年的在线外语词典Linguee,DeepL翻译也完全由Linguee团队打造。Linguee在国内没什么存在感,至于在海外……有谷歌翻译专美于前,存在感也不是很高,但还是有一批认可它的用户。什么是deepl,deepl究竟靠谱吗?

Linguee的英汉、汉英词典界面

不过,Linguee的成败现在已经不重要,毕竟都换马甲了——Linguee在今年正式更名DeepL,以“Deep”提醒VC自己是一家正儿八经的深度学习公司。

真正重要的是Linguee的技术积累。Linguee由前谷歌翻译研究员GereonFrahling在2007年离职开发,2009年正式上线。就所知,Linguee的核心优势是它的爬虫和机器学习系统,前者抓取互联网上的双语对照翻译,后者对这些翻译的质量进行评估。两者结合,使Linguee成为了当时“世界上首个翻译搜索引擎”。十年积累,Linguee无论在数据和对算法的研究上都不可小觑。什么是deepl,deepl究竟靠谱吗?

去年在伦敦Noah上演讲的GereonFrahling

一年前,其研究团队着手欲实现一个新目标:利用在机器翻译领域的多年专业积累,打造一套业内最先进的NMT系统。这便是8月29日上线的DeepL翻译。

三大优势

既然底子厚实,我们来看看这些积累给DeepL带来了哪些资源优势。

以下信息均是DeepL一家之言,尚无第三方背书,大家需自行判断其含金量。

  • 数据

Linguee的数据集有逾十亿组对照翻译语句,号称是世界上最大的人工翻译数据集。Linguee能随时搜索近似翻译结果。

  • 计算力

DeepL在冰岛搭建了一台超算,号称在全球HPC中性能排名第23位,浮点运算能力达到5.1petaFLOPS。因而能实现令DeepL十分自豪的计算速度:每秒处理百万量级的词语翻译。

  • 算法

采用CNN而不是NMT产品通用的RNN。DeepL宣称其技术积累使得它能够克服CNN的主要短板,因而能实现比基于RNN的竞品算法更精确、自然的翻译结果。

效果展示

DeepL宣称其翻译系统的表现打败了谷歌翻译以及微软、Facebook的NMT系统,是基于两个指标:盲测反馈和BLEU分数。

  • 盲测

DeepL邀请了职业翻译者,对DeepL翻译、谷歌翻译、微软翻译以及Facebook的NMT系统进行了盲测,要求测试者选出所认为的最好的翻译结果。测试语言为三组,分别是英德、英法、英西互译,样本为100个句子。DeepL并未公布每组参与测试的职业译者数量。测试结果如下:什么是deepl,deepl究竟靠谱吗?

如图所示,在每一门测试中,选择DeepL的测试者都最多。DeepL在英译德、英译法、英译西的优势尤其明显。其官方统计是:选择DeepL为最佳翻译结果的次数,与选择另外三家NMT服务的平均比例为3:1。

  • BLEU

BLEU是业内评估机器翻译质量最常用的打分算法,其得分被认为与人类的评判结果具有较大相关性。

DeepL宣布,其英译德、英译法的BLEU得分超过了所有已发表的NMT研究,包括谷歌Transformer。结果如下:什么是deepl,deepl究竟靠谱吗?

如图,在英译法项目上,DeepL的BLEU分数超过次优方案约3.5%。

业内观点

踏入江湖的第一日,DeepL就自封“天下第一”。业内同行对此怎么看?

对此,咨询了搜狗语音交互中心总监陈伟、商鹊网CEO邹剑宇,以及Facebook机器学习工程师王杨。需要说明的是,三位老师均表示:由于缺乏关于DeepL算法、数据库的第一手资料,也没有来自第三方的信息,无法对其翻译水平做出客观判断。商鹊网的CEO邹剑宇评论道:“从相关报道中,对算法的描述并不详细,没有论文披露细节,所以并不好理解。“

因此,以下仅为这四位看到DeepL宣传信息后的一些个人看法。

一、

在Facebook从事应用机器学习的工程师王杨,听到这件事的第一反应是怀疑——单是同时胜过谷歌翻译和FacebookNMT这一点,不拿出有足够说服力的证据就难以取信于人。谷歌的NMT积累深厚,Facebook的NMT也在快速发展。一个新的产品想要如其所宣传的那样实现大幅超越,很难。

若DeepL确实在技术上实现了突破,那么不排除他们有全新的多语种(multilingual)模型。

至于DeepL的算法模型基于CNN而不是RNN,王杨表示“这从侧面支持了Facebook的研究”。FAIR(FacebookAIResearch)一直认为CNN在机器翻译上的潜力远远大过RNN,尤其是计算速度,这也是Facebook在NMT领域的主要研究方向之一。

二、

搜狗语音交互中心总监陈伟,他们机器翻译团队刚刚在WMT2017评测中获得中英、英中两个翻译方向的第一名,他认为数据对DeepL的贡献可能远大过其它因素。而Linguee的数据爬取和积累,是一项不小的优势。

陈伟评论道:

据一位德语专业的译员说,DeepL德英互译的体验确实不错,这丝毫不意外——作为一家德国公司,顺理成章的,DeepL重点关注的是德英、法英这些语种的翻译。这为DeepL在这几门语种的数据积累也提供了一定的聚焦和便利。

DeepL公布的盲测、BLEU评分,衡量的均是德、法、西这三门欧洲语言与英语之间的互译。

在算法方面,陈伟表示:

他并不认可“CNN是神经机器翻译未来”的说法:

最后,陈伟总结,根据DeepL公布的报告,目前的评测存在三个地方导致难以评估其技术:

  1. 人工评测的测试数据量仅有100句,而一般人工评测或者BLEU评测会采用几千句的数量。
  2. DeepL对比其他家并没有使用相同的训练数据集,因此性能无法很好评估。
  3. 更多的技术细节没有公布,很难把握具体的情况。

三、

商鹊网CEO邹剑宇十分认同数据和计算资源对NMT产品的重要性:

对于BLEU值究竟能在多大程度上客观反映翻译质量,邹剑宇强调,需要合理看待其参考价值,不可把它等同于普通人面对翻译结果的直观体验:

他最后忍不住拿自家产品做对比,表示商鹊网的新引擎甚至达到了比谷歌翻译高出6个百分点的BLEU值。

好了,这篇文章的内容营销圈就和大家分享到这里,如果大家对网络推广引流和网络创业项目感兴趣,可以添加微信:Sum8338 备注:营销圈引流学习,我拉你进直播课程学习群,每周135晚上都是有实战的推广引流技术和网络创业项目课程分享,当然是免费学!

版权声明:本站部分文章来源互联网用户自发投稿,主要目的在于分享信息,版权归原作者所有,不承担相关法律责任。如有侵权请联系我们反馈邮箱yingxiaoo@foxmail.com,我们将在7个工作日内进行处理,如若转载,请注明本文地址:https://www.yingxiaoo.com/97969.html