“亿级翻译需求”存在吗?

TIME:2021-09-03 | WRITER:admin

敏言翻译君按语:

2013年底我和搭档魏勇鹏创办公司的时候,他说了两件事:一是,谷歌机器翻译几乎不再聘请语言学专家了,由懂得统计、计算的计算机专家主理开发。二是,谷歌有世界上最丰富的多语言语料数据,但对这种基于数据统计训练而成的翻译引擎来说现状有点尴尬,更多语料能带来效果不再明显了,尽管谷歌的语料、用户量和使用量都在日益增多。

在我们运营公司的两年多时间里,遇到了很多客户和投资人,他们问的第一句话是:“你们机器翻译能达到什么样的准确度?”这个问题意味深长,我一般只能回答说:“在某些垂直领域,我们比谷歌翻译要好。”这句带有挑衅意味的话让听者将信将疑却无从反驳,因为Ta从未得到过无瑕的机器翻译体验——像科幻影视文学、类似《星际迷航》里展现的,那边阿凡达星语说出来,这边火星人听进去,毫无停顿卡带的痕迹。

行内人用专业尺度评价机器翻译的现实是这样:美国商务部下属的国家标准与技术研究所NIST举办的一项机器翻译研究水平评测,采用BLEU(Bilingual Evaluation Understudy)标准。 其原理是比较机译结果和人译结果的相似度,完全一致得分为1(当然不同的人的翻译很难“完全一致”,所以得分1为理想值)。2008年NIST的英文-中文的机器翻译评测结果,谷歌翻译得分0.4142,微软亚洲研究院提交的测评是0.4099,厦门大学得分0.2502;谷歌和微软亚洲的中文-英文机翻得分分别是0.2999和0.2901,中科院自动化所的得分是0.2407。

2015年9月第十一届全国机器翻译研讨会(CWMT 2015)上,中国超过10所科研所和大学参加了机器翻译的评测。同样以BLEU值为标准,英汉新闻平均得分接近0.35,汉英新闻则接近0.25,日汉新闻质量最好——高分超过0.5;英汉科技则普遍超过0.35,高分0.43。国内语种的机翻效果更好,藏汉政府文献的最高分0.61,维汉新闻的最高分0.54。

囿于测试所选文档和评测方法,该数值结果和普通人阅读体验有可能偏差很大。权当参考:机器翻译中有40%左右的结果,用户可以较为容易理解使用。和阿凡达电影场景的效果,和此时此刻用户/投资人对人工智能产业的期待相比,还是弱爆了。不过,2013年谷歌翻译每天的用户量超过2亿人、翻译10亿次,每天翻译的文字相当于100万册图书,超过全球专业翻译一年的工作量,他们用的就是BLEU值40%左右的机器翻译。

“人工智能领域没有取得任何进展,”英国理论物理学家戴维·多伊奇在其著作《无穷的开始》里说:“因为在其核心里有一个悬而未决的哲学问题:我们还不了解创造性如何运作。一旦解决了这个问题,编程实现人工智能将不是难事。图灵发明了图灵测试,希望绕开这个哲学问题。换句话说,他希望在解释这项功能之前就实现这项功能。不幸的是,类似这样的情形极为罕见。”(图灵测试由计算机科学和密码学的先驱阿兰·图灵于1950年设计:如果电脑能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则电脑通过测试,它被认为具有智能。)

“现在我们谈的比较多的是人机链接,就是把大脑和计算机相连,用机器扩展人类的思维能力。我觉得这一点利用目前的老式计算机是无法实现的,因为人脑在我看来更接近于量子计算机,我们人类与电脑的区别在于,电脑你输入什么,它输出什么,唯一的例外是它死机了。而输入相同的信息,人类的输出是不可预知的,这就是人类的自由意志。我认为人类的自由意志是以量子计算为基础,是一种模糊的计算而不是逻辑计算。”中山大学天文与空间科学研究院院长李淼说。

按照中国人工智能泰斗、中科院院士张钹教授的分析,人工制造的智能机器即使有了自主意识,也是机器的意识,比如“有一个机器人会做勺子,而且它像人一样‘有意识’自主工作,这个机器人可能耗尽地球的资源来生产勺子,因而对人类产生威胁”。

虽然数据在增加,但是主要基于统计计算的人工智能不能满足人的意志和情绪需求。至少在基于逻辑计算的机器翻译领域,语料数据的增长与翻译准确度不再成正比,让机器理解人的努力尝试卡在半山腰。

在用户和投资人对人工智能有爱有期待的时候,这个梦醒得有点残酷。不管所谓机器智能是否是真正的智能,在某些场景下,它已经开始发挥价值。我的一个朋友、中科院自动化所的博士生黄国平讲的话很有力量:“即使是现在的机器翻译,用好了照样震爆世界。”他的意思是:机器已经做了40%、垂直领域的引擎能提供超过50%的有效结果,理论上最好的翻译项目能提高50%的效率,机器的生产能力同样令人乍舌。

可预见的时间里,机器翻译一直都会不完美有遗憾。其实这也是一个好消息,它给人留了尊严和安全感,保留了翻译职业,甚至为译员提供了更多的商业需求和更多的工作岗位。

不人性的一面

我在翻译生产中遇到了三个译员(以下用化名),三个案例和机器翻译的关系层次分野清晰。

23岁天秤座张林林姑娘,南京某大学英语系大四学生,参加译后编辑(基于机器翻译结果作人工优化)培训2个月,她的感受是“译后编辑很大程度上提高了翻译的效率,但是会对译者的翻译的风格和思维有一定影响和改变”,工作效率从最初每小时完成2件任务提高到了3-4件,兼职月收入达到了3500元。

24岁水瓶座孙青青姑娘,河北某大学商务日语系毕业,对译后编辑的感受是“比如有些句子比较难懂,句子结构组织起来比较困难,机器译文起到了好的提示作用”,培训半年后转为全职译员,一小时稳定完成4件,月收入超过1万。

第三位是25岁的白羊座小伙子小韩,大连外语大学日语毕业生,他说“有的机器翻译只需调整语序即可,跟纯手动翻译相比,极大地提高了翻译效率和准确性”。他的效率是一小时完成5件,兼职做翻译月收入9千元。

从受机翻结果影响,逐渐到以机翻结果为主做优化,译后编辑的译员的工作方式和传统人脑翻译、词典辅助的模式有很大区别。他们的工作流程发生了明显变化,从90%的时间进行逐字逐句翻译,转变为超过一半的时间来理解术语和机翻结果,真正动手“翻译”句子段落的时间仅为过去的小一半。结果是“翻译”时间越少的译员,效率最高,收入也最高。

2015年第四季度,麦肯锡全球研究院发表报告《如何利用AI重新定义工作》,开篇的第一句话就是“随着体力工作和知识工作自动化的进步,许多工作至少在短期内,会被重新定义而不是被消除”。我们在译后编辑译员身上看到的是机器翻译并没有改变翻译职业,但是新的流程却改变了译员。译员在工作中术语的选择、词句段落编排等过程在系统中都被记录下来供机器学习,译员是语言数据和系统的使用者,也是数据生产者。最有效的状况可以被描述为:译员是机器翻译的研发和生产的延伸,其思维和行为被技术化了。

好的一面,麦肯锡的报告说“到2025年将有50万亿美元的价值会被人工智能和机器人创造出来”,坏的一面则是有些译员会觉得不适,不适应的结果是拿不到好工资甚至新的翻译工作不需要Ta,可能被批评为反人性。我自己倒是觉得不能说带个大头盔看VR的技术是人们喜闻乐见,而改变思维、工作习惯的译后编辑是不人道的,就像上个世纪初把走路变成踩油门、把方向盘的开汽车一样。“人机链接”无法实现的时候,“人机结合”是人与机器之间有效的合作方式,也是一个更准确、让大众更安心的用词。

与译后编辑类似的场景,出现在医疗大数据的应用里。医生诊断时,能看到的是机器给出来类似的病例和对应的诊断汇总,也许还给出状况接近案例的诊断处方推荐。机器不会直接给人看病,医生和译后编辑译员一样选取Ta中意的参考再给出诊断。不过人们对此的担心少很多,“医生为自己的诊断书负责嘛,机器干不了这个事。”

亿级需求

新的互联网翻译还有一条路径是属于共享经济的社会化生产,国内外的翻译行业诞生了很多众包翻译服务平台,但是效果堪堪,一直没有实现期待中的结果。原因是众包平台为需求匹配到合适译员的成本,高于网络众包生产的效率收益,生产过程和结果的非标准化带来的工程管理成本更高了。

就在为众包困局很困扰的时候,我与中国最大的非标服务众包平台猪八戒网的朋友有过几次深入的交流,双方达成的共识很特别:服务众包的核心在于供应端,而不是互联网经济的主流思维“客户第一、需求至上”。猪八戒网的一个主要品类“建筑设计”,包括供应商的招募、生产和质量、客服等的运营管理交给了猪八戒与设计行业某上市公司的合资公司来打理。

翻译也是一样,个人、企业和机构的需求时刻都存在,但是中国超过3万家提供“翻译”服务的公司,最大的年收入只有3亿元,规模狭小甚至还不够成为一个行业,而大部分的需求没有被好好满足,译员该挣的钱挣不到。行业短板非常明显:小规模、几个兼职译员的公司用师傅带徒弟的作坊生产方式,能提供的服务能力有限,更谈不上质量、客服标准化。

由机器来统一基本劳作规范,完成部分翻译量,组合大量译员完成剩余优化任务的模式,有望推进辗转不前的众包翻译来完成行业的跳跃发展。发展动力的基础是机器翻译,其实更主动的是人(译员)。译员在理解和使用机器翻译辅助软件,改变翻译习惯以更好使用机翻结果,不同学生的可塑性不一样,导致工作效率和收入的差异。因此翻译的人机结合催生了一个重要的学习培训需求,其教学过程甚至是重新探索了译后编辑这个职业的从业标准。

翻译服务能否从小作坊升级到互联网上的富士康? 我看不出不能的障碍在哪里。计算机技术工具&大数据学习,基于互联网平台管理、培训和生产,以及中国独一无二的全语种外语教育体制和数量第一的外语人才储备,地利和人和都在了,下面看看市场需求的天时到没?

全球化的深入不再是只有部分人出国观光,从吃买玩,到投资学习工作,乃至生老病死都不会是局限在出生国家的事情。圣经里上帝让各族人说不同语言的设计制造了天成的刚需,多语言交流需求不是敢不敢想,而是能不能做的问题。它意味着产能巨大、稳定和低成本的翻译服务,满足这一需求的新翻译生产方式,一定是包含了机器翻译软件、基于互联网的供需众包和协作生产、以及译员用以学习、分享的互联网社区培训平台。

能不能让淘宝、亚马逊的商品全部被不同国家的顾客直接看懂,让中国的股民了解所有纽交所、纳斯达克股票交易的信息和后面的公司行业资讯,让国内外新发表的论文文献同步多语言出版,让美国最大的医讯网站整站的优质内容占领目前被莆田医生笼罩的中文网络?使用谷歌、有道免费翻译工具自助阅读的人越来越多,这显然不会是互联网社会大规模多语言交流的唯一方式——如上面所说,缺点太明显,对用户的知识、技能挑战过高,只是因为免费才可以容忍。

拥有行业和外语知识人士提供的专业翻译服务的需求会更旺盛——只要价钱合适;更重要的是合格的翻译能力才能对接有质量要求的商业内容,促成有利润的商业项目。翻译服务体量从每单几百元、上千元,提升到每单几千万、上亿元,成本则下降40%-80%。二十年的互联网经验告诉我,一个互联网项目亿元的运营成本不可怕,投资人和运营人担心的是每年数亿元的投入能否带来倍增的收益。翻译仅仅是打破语言障碍的第一步,进一步的知识管理和服务,是信息里蕴藏的更大金库。

从这个逻辑来说,人机结合的翻译花得起亿级的钱,也挣得到10倍以上的收入和可观的利润,它在抄过来的路上。

本文转自:英国《金融时报》中文网“商业”专栏,作者系商鹊网联合创始人、首席执行官邹剑宇 。本文仅代表作者观点。