尽管川普的走马上任更多与“逆全球化”绑定在一起,但考虑到人类历史“螺旋状”上升的演化轨迹,在技术进步和文化扩散的双重推动下,这个世界总体趋向互通互联的趋势似乎不可违——尤其当全球化与网络相遇的一瞬,不同国家之间平等便捷获取信息,低成本地有效沟通即成一种必然。从这个意义上,全球化的最大敌人之一也许是各国千百年来夯实的语言壁垒。

作为一门交叉学科,机器翻译涉及到认知科学,计算机,信息论,语言学等多学科,其理论路径同样经历了螺旋状上升:从最久远的“翻译备忘录”到后期基于规则,基于实例的机器翻译,再到被视为机器翻译重要转捩点的统计翻译模型(SMT)——后者是科学家初次察觉到通过大数据消弭信息不确定性是攻克“智能”的好办法。

而最近两年,机器翻译正在拥抱另一个更重要的技术转折点——基于神经网络的机器翻译(NMT:Neural Machine Translation)。

机器翻译的技术路径

感同身受的是,无论是普通用户还是资深译员,无论使用WEB还是APP,都明显察觉到近些年来的翻译质量有着迅猛的提升。

问题是:为何变化如此明显?不妨从技术路径上拆解来看。

直觉便知,当人类试图让机器翻译语言时,自然要对文字进行解构,就像同心圆的关系,文章由段落构成,段落由句子构成,句子由短语和字构成,而遵循从易到难,机器翻译的理论路径也是从后向前:从最初的逐字翻译到基于短语的翻译——如今,依靠于神经网络,基于句子的翻译成为可能。

于是,按照翻译单元的不同,大体而言,目前机器翻译有两种类型:其一是上文提及的统计翻译模型(SMT),如你所知,互联网的广泛普及为统计翻译提供了丰富的训练养料,而千禧年左右兴起的基于短语的SMT更是让机器翻译质量大为提高,也在很长一段时间占据机器翻译的主流,但以短语作为翻译单元的弊端即是,当面对整句层面的翻译时显得非常生硬。

另一种类型当然是基于神经网络的机器翻译(NMT),其翻译路径是所谓端到端(end-to-end),将源语句整体编码为一个向量,再通过解码器对其进行解码,理论上仅需给定源语言句子,即可通过神经网络输出目标语言译文。这里不妨举个例子,若你在百度翻译中输入“萝卜青菜各有所爱”,它可以轻松输出“Every man has his hobbyhorse”的正确译文,而非诸如“Turnip greens his taste”的荒诞结果。也正因如此,短短两年,NMT就在多个公开测试集上超越了作为前辈的SMT系统。

而若要比较的话,整体而言,在数据训练比较充分的时候,NMT无疑要优于SMT;在短句或数据量相对较小之时,SMT在处理固定搭配和习惯表达上具有优势。所以两种方式谈不上殊途同归,只是在不同场景中分类而用——要知道,用户的翻译场景颇为多变,这要求一个优秀的翻译系统要成为集大成者。如今百度的翻译系统就包含SMT,NMT,甚至更传统的EBMT(基于实例的机器翻译)。

当然,倘若我们谈论的是未来,几乎可以肯定,神经网络技术本身的向前奔进,会让NMT日趋成为主流(事实上,在百度中英日韩等多个系统中,它已是主流)——在今年8月的国际计算语言学年会上(ACL),移动端离线NMT被列为未来重要研究方向,即是为机器翻译的未来画了一个几乎确定性的脚注。

机器翻译的跑马圈地

自二十世纪三十年代初法国科学家阿尔楚尼提出用机器进行翻译的想法至今,哪怕对人工智能的定义已几经翻折,机器翻译都被长期视为人工智能的“终极目标”之一。巨大的期许往往意味着目标艰难,但这仍然无法阻挡这块大蛋糕对全球顶尖科技大佬的吸引力。

而作为翻译技术发展的初级阶段,如果在这个时候硬要拼个排名或者高下,其实并没有太大意义,而科技界的竞争也无非就是微软、百度、谷歌这三家而已,孰轻孰重一看便知。只不过,从“百度更懂中国”的大思路能够看出,百度在中国乃至亚洲市场更具侵略性,和搜索之争同理,虽然谁都打不死谁,但区域优势已成不争事实。

12月21日,从百度机器翻译技术开放日上百度技术委员会联席主席、自然语言处理部技术负责人吴华博士的观点可以看出,百度其实已经成为了翻译技术领域的破茧者,他们早于谷歌一年就正式上线了基于神经网络的翻译系统,同时也打造了全球首个互联网在线NMT系统以及手机端离线NMT系统。据悉,百度翻译每天已有上亿次访问,支持28种语言的互译,开方的API接口也有超过2万家第三方接入。

而就在前几天,微软发布全球首个万能翻译器,微软官方表示它也可以实现多达100人间实时翻译交谈,并支持9种语言的语音输入。而谷歌全球化带来的影响无疑的巨大的,在收购科技公司的同时也在大力发展区域化优势,如谷歌2014年收购的Word Lens也在积极开展机器翻译的工作,这李彦宏所说的话是一样的道理:用人工智能打破一切边界。

其实,百度的现状其实并不令人意外,考虑到中国经济在全球化中的地位,在将更多人卷入全球化的社会协作网络过程中,中国对翻译行为的仰仗无疑更迫切。而更为现实的是:在全球数万亿网页中,80%为非中文网页;去年中国出境游人数超过1.2亿,前20个旅游目的地国家和地区中共使用了12种语言,尤其是中英语——这个世界上使用人数最多和使用最广泛的两种语言之间的翻译,在很多人眼中是纯粹的刚需。

机器翻译的未来

很简单,翻译技术最终是要服务大众,否则就是镜中月、水中花。

重要的是,技术也逐渐还原到更具体的实用场景,百度翻译APP就通过结合OCR技术和语音技术,为用户满足各种碎片化的翻译需求,举几个例子:当你在国外游览时,只需将手机屏幕对准外文介绍,OCR翻译即可呈现翻译结果;面对天书一般的外文菜单,百度翻译可以迅捷地将菜单翻译结果显示在手机上,从此不必再在点餐时听天由命;在国外买买买时,它也能让你快速读懂说明书;另外,当遇到不认识的实物,实物翻译可以用中英双语告知其名,同时伴随着准确的发音;而结合语音技术的会话翻译,能帮助用户与外国人无障碍交流——我甚至还看到过这样的新闻:靖江市民警在语言不通的情况下,用百度翻译成功救助4名俄罗斯籍船员……

技术的福祉正在惠及每一位担心语言关的人,而另一端,一部分人对技术的忧虑也在所难免。“未来若干年,我们很容易想象语言障碍会完全被打破,现在做同声翻译的人可能将来就没有工作了。”上个月的乌镇互联网大会,李彦宏为人们勾勒了未来的场景。

机器虽然突破了固有翻译原则的局限,但必须承认的是,机器翻译和真正意义上的“语言学”还关系不大,距离文人向往的“信雅达”目标还很遥远,这也意味着,机器翻译任重道远,人工翻译可稍安勿躁。

究其原因,在基于端到端的翻译手法中,神经网络无法理解自己翻译出的句子,无法对译文给出一个合理解释——这正是它与专业人工翻译最本质的差别。譬如,遵循上文提及的从后向前(从易到难)的理论路径,让机器理解基于“段落”甚至“篇章”的翻译自然再好不过,这要求机器在上下文理解和连贯性上飞跃一大步。

那么问题是:它会实现么?作为技术乐观主义者,我个人答案当然是会,一切或许只是时间问题。

在昔日古老的岁月,人类诞生语言的原始目的,一方面是增进本族人的内部沟通,另一方面是制造与外族的天然隔阂。而若你相信技术的发展内嵌在全球化的伟大浪潮中,通过技术终结千万年来人类语言互不相通的历史就值得期许。毕竟,让人们听懂彼此,这是一个太过古老的夙愿。

相关新闻

  • 陈冷西:规范网络传播势在必行

    陈冷西:规范网络传播势在必行

    国家新闻出版广电总局日前发布《关于加强微博、微信等网络社交平台传播视听节目管理的通知》要求,利用微博、微信等各类社交应用开展互联网视听节目服务的网络平台,应当取得《信息网络传播视听节目许可证》等法律法规规定的相关资质;微博、微信等网络社交平台不得转发网民上传的自制时政类视听新闻节目。 此前,文化部印发了《网络表演经营活动管理办法》,直接对准网络直播平台,规定直播平台须有许可证,主播要实名。两部门相继出台规定,对网络视听类节目和直播平台加强管理、明确监管办法,直指网络动态传播的混乱局面。 伴随网络…

    媒体报道 2016-12-22
  • 首汽约车回应《细则》:坚定不移贯彻要求 踏实服务

    首汽约车回应《细则》:坚定不移贯彻要求 踏实服务

    新浪科技讯 12月21日消息,北京市交通委于今天正式颁布了《北京市网络预约出租汽车经营服务管理实施细则》(下文简称《细则》),对此首汽约车回应表示,这标志着北京网约车行业终于进入有法可依的时代,首汽约车将坚定不移地贯彻《细则》要求,踏实服务,合规经营。 首汽约车表示,下一步,首约一是要积极完成平台相关资质认证工作,一如既往地配合行业监管。二是不断优化产品,为用户提供更加便捷、舒适、高效的出行体验。三是做好线下服务,不断精雕细琢服务品质。四是积极承担社会责任,在缓解交通拥堵、服务特殊人群出行、做好…

    公司新闻 2016-12-22
  • 揭2016热销洋货 网易考拉圣诞大促主打榜单经济

    揭2016热销洋货 网易考拉圣诞大促主打榜单经济

    从双11到双12,再从黑五到圣诞,2016年年末电商大战持续上演。作为唯一参加双11、黑五、双12的最大跨境电商平台网易考拉海购,日前也宣布在12月23日-25日启动圣诞跨年季大促,不打价格战而是主打榜单经济,将发布2016年网易考拉海购年终大赏,盘点揭秘2016全年值得买买买的洋货,满足用户更专业、更个性化的海淘需求。 主打年终大赏 年终大赏是本次网易考拉海购圣诞跨年大促的最大亮点。在大数据技术支持下,网易考拉海购通过挖掘全年销售数据,推出好评风云榜、海淘新奇特、黑马进击榜 、三石口碑榜、吐血…

    公司新闻 2016-12-22
  • 网约车要变天,滴滴之类C2C模式全面沦陷

    网约车要变天,滴滴之类C2C模式全面沦陷

    京沪两地不约而同的公布了网约车执行细节,相比北京预留了5个月过渡期不同,上海则在公布之后即刻开始执行。从细节的相关内容来看,随之而来的可能是引发行业震动,或许会成为两种不同的网约车模式的分水岭。 中国网约车市场分为两类模式,一类是以Uber、滴滴出行为代表的C2C模式,一类是以神州专车、首汽约车为代表的B2C模式。此次京沪两地公布的网约车细节,对于C2C模式是毁灭性的打击,而对于B2C模式则是一大政策利好。 不难预见,未来中国网约车市场将集体走向B2C模式的发展之路。 C2C失去生存土壤 以Ub…

    行业动态 2016-12-22
  • 湖南医聊等13家自媒体获2016年度影响力自媒体奖

    湖南医聊等13家自媒体获2016年度影响力自媒体奖

    12月21日,“城市力量”2016腾讯区域影响力峰会在北京盛大启幕。一大批优秀的自媒体脱颖而出,影响力逐渐扩大。那么,2016年度最具影响力自媒体都有哪些? 华中科技大学新闻与信息传播学院钟瑛教授,腾讯区域内容总监、大湘网总裁邓科颁发13项影响力自媒体奖,获奖名单: 获奖人:湖南医聊(大湘网推荐) 获奖理由:“湖南医聊” 注册于2016年3月,专注医疗健康科普资讯 。截止目前,在企鹅媒体平台共发稿924篇,累积阅读量400万+,多篇稿件被天天快报、腾讯新闻客户端PUSH,也被腾讯迷你首页重要位置…

    行业动态 2016-12-22
  • Facebook 全球货币战略:从企业进化成“超级国家”

    Facebook 全球货币战略:从企业进化成“超级国家”

    民族国家是人类有史以来最强大的社会结构。数以百万计的人因为这样或那样的原因联系在一起,起草管理社会网络的法律。组织这一网络的原因可以任意,如信仰不可剥夺的权利,或共同的语言、地理、经济等。因此,官僚和独裁者,无论是否由选举产生,都会起草法律来影响通讯,管理社会组织,建设基础设施,并为他们的社会做出经济决策。如此一来,少数人的决定会影响许多人的生活——无论是好是坏。 Facebook监管着一个平台,这个平台就影响着通讯、管理着社会组织、建设着基础设施,并为有史以来规模最大的社会网络做出经济决策。虽…

    公司新闻 2019-05-29
  • 被华为反超,一季度iPhone在全球智能手机市场份额降至第三

    被华为反超,一季度iPhone在全球智能手机市场份额降至第三

    本周二,来自市场研究机构Gartner的研究报告再度向人们确认了一件事:苹果在全球智能手机市场上的位置已被华为所取代。 Gartner的报告显示,2019年第一季度,iPhone在全球智能手机市场的份额已降至11.9%,同比下降2.2%,销量也从2018年第一季度的5410万台下跌至约4460万台。 对此,该机构研究主管Anshul Gupta在报告中写道,iPhone在各个市场上的降价策略虽然提振了需求,但仍不足以恢复第一季度的增长: “苹果面临着更长的更换周期,因为用户很难看到有足够的价值效…

    媒体报道 2019-05-29
  • 都说行业冷,凭什么这家VR公司10个月能融到3轮?

    都说行业冷,凭什么这家VR公司10个月能融到3轮?

    导语:也许VR对许多人来说还只是一个小众的、新奇的概念,但在科技企业林立的深圳,这一产业发展的速度已经远远超过了人们的想象。 在各种琳琅满目的“深圳制造”的VR产品之中,在大大小小近100家VR企业里,有这么一家成立仅一年的初创公司,凭借过硬的技术基因连获三轮融资,最新的产品更是在今年CES上一举夺得最佳创新大奖。 它就是深圳看到科技,一家专注于360度全景VR相机的科技公司。近日VR陀螺通过与联合创始人兼COO蔡树焕先生的访谈,揭开了这个在行业内如此“低调”,在技术上却十分“高调”的初创企业的…

    公司新闻 2016-12-22
  • 千亿茶饮市场的资本战局:最终竞争对手是瑞幸?

    千亿茶饮市场的资本战局:最终竞争对手是瑞幸?

    潘攀一直预感中国会有一个类似星巴克的国际品牌,去年年中,他对媒体说,“这个品牌一定与星巴克不一样。这会是一个结合中国文化的产物,茶是一个很好的载体。”潘攀是天图投资的管理合伙人,从投资八马茶业开始,便一直关注着茶饮市场的更迭。 这种预感并非空穴来风。一年2.1亿外卖订单,销量远远高于咖啡,爆红茶饮店的生意甚至一杯难求。这是一个远比咖啡更大的市场,并且能够无线拓展下沉空间,根据中商产业研究院的估算数据,现制新中式茶饮的市场规模接近一千亿元。 资本也在涌入这一市场。CV Sourse披露数据显示,自…

    行业动态 2019-05-28
  • 各大科技公司纷纷涉足无人驾驶:2016是无人车转折年

    各大科技公司纷纷涉足无人驾驶:2016是无人车转折年

    导语:CNN网站近日撰文称,2016年成为无人驾驶汽车的重要转折年,为这项技术今后的发展奠定了良好基础。 以下为文章全文: 如果说美国总统大选是今年的最大新闻,相信所有美国人都不会有异议。 但与此同时,无人驾驶汽车也开始步入正轨。科技企业和创业公司都在争相开发这项技术。就连通常站在幕后的政府也纷纷介入其中。 无人驾驶行业吸引的大量资金、人才和时间将极大地改变我们的生活方式。关于无人驾驶汽车将在何时走入主流,目前的观点尚未统一。但要不了多久,这就有可能成为全年最大的新闻。 2016年伊始,通用汽车…

    行业动态 2016-12-22
联系我们
关注微信
关注微信
分享本页
返回顶部