项目背景
天猫海外重点运营的7个国家与地区中,目前台湾体量排名top2。对台湾地区的query进行数据分析,繁体中文query占比很高。而繁体中文query和淘宝简体中文商品之间的匹配需要将query语言转换到简体中文才能提供给买家更准确的商品结果,因此需要繁中到简中的转化。
工作范围:
人工语言识别:若原文为繁体中文(台湾),请选择 zh-TW;
若原query为繁体中文(台湾)外的语言或原query意义模糊无法翻译,则选择 0。
原文修复:
- 若原文有缺失、错别字或错误,且译员能明白意思的,请对原文进行修复。
(对于correctable issue,请参考:https://docs.alipay.com/l10ncenter/vv5u7s/pzlnyr Session 5.2)
如:
source: 存摺叠收纳箱
Corrected Source: 存储摺叠收纳箱
target: 存储折叠收纳箱
- 若原文为台湾繁体用法,但文字是简繁混合,请订正为繁体再翻译:
如:
source: 乾式湿式两用
Corrected Source: 乾式濕式兩用
target: 干湿两用
- 如原query不是地道的台湾繁体用法,工作时不需要因此对原query进行订正,如:
source:大碼 泳裝
corrected source: 大尺碼 泳裝[此处应留空,不需要订正原文]
target: 大码 泳装
人工翻译:提供人工翻译。
生产标准:
原则:译文符合当地用户的搜索习惯。
该项目不是繁体中文与简体中文的简单转码,请关注两种语言、文化间在电商领域的表达差异。如:
數位相機 —>数码相机(而非“数位相机”)
夏季寬褲套裝 —>夏季阔腿裤套裝(而非“夏季宽裤套装”)
針織洋裝 —>针织连衣裙(而非“针织洋装”)
小小兵—>小黄人
契爾氏 —>科颜氏(而非“契尔氏”)
项目中一般情况下不允许存在错译、漏译、增译与不译的问题,不允许出现错别字。
验收标准:
通过标准为 99%(按条)。
特别说明:
关于语言识别:
如果query在繁体中文(台湾)中与简体中文中字型相同且意思相同,则此query判定为简体中文,在语言识别中填写0,无需翻译;
例:披肩(zh-TW)—>披肩(zh-CN)
繁体中文(台湾)中有与简体中文字型相同但意思不同的词语,此时需要在语言识别中识别为zh-TW,且需要翻译:
例: 土豆(zh-TW) —>花生(zh-CN)
原query为英语+台湾繁体(一般情况下为英语品牌/系列名+繁体中文的产品名),判定为繁中,需要翻译为简体中文。如果是英文品牌、常见产品,在中文上没有对应的译文的,不需要强制翻译成简中。如果有中文译文,且中文表达很常用,尽量翻译。如果中文表达不常见、感觉不需要非要翻译过来,可以不作翻译。品牌名/系列名的翻译以官方翻译为准。
例如:gor鋼化玻璃保護貼 —> gor钢化膜
samsung galaxy s7 鋼化膜 —>三星 galaxy s7 钢化膜
fujifilm fx 轉接環—>fujifilm fx 转接环
英语+简体,识别为简体,无需翻译。
例:Panasonic 无绳电话
关于标点:原文译文在标点上保持一致。
如: 【bandai】魔法貼紙派對補充包—>【万代】魔法贴纸派对补充包
关于单位:无需换算,原文译文一致即可。
关于原query中有错别字的:应在译文中进行纠正,译文中不允许出现错别字。
由于该项目涉及产品广泛,译员对于不熟悉的产品以及表达方式应多做调研,力图找出最地道、应用最广的说法。
如有未提及之问题,请咨询阿里PM。