什么是自动质量检查

自动质量检查是系统根据一定规则自动检查译文中是否存在翻译的一致性、术语、数字、标点、间距、格式等低级错误。

自动质量检查报告查看

  • 翻译完成后在项目详情页触发自动质量检查

image.png

  • 可下载或在线查看质量检查报告

image.png

  • 检查项对应含义如下 | 序号 | 质检类型 | 约束 | 描述 | | —- | —- | —- | —- | | 1 | Numeric Mismatch | | 原文和译文内的数字一致性检查,原文有的数字译文内没有,或者原文没有的数字而出现在译文内。即原文和译文双向都检查,包括数字的内容、个数是否一致。 | | 2 | All UPPERCASE Mismatch | | 原文和译文内的“全大写”单词一致性检查。若原文的全大写单词未出现在译文内,或原文没有的全大写单词而出现在译文内。即原文和译文双向都检查,包括全大写单词的个数和内容是否一致。 | | 3 | CamelCase Mismatch | | 原文和译文内的驼峰字(单词内含有两个及以上的大写字母,同时含有小写字母)是否一致。若原文的驼峰字单词未出现在译文内,或原文没有的驼峰字单词而出现在译文内。原文和译文双向都检查,包括驼峰字个数和内容是否一致。 | | 4 | Alphanumeric Mismatch | | 原文和译文内的字母+数字组合的单词是否一致,即原文和译文双向都检查,包括组合单词的个数和内容是否一致。 | | 5 | Inconsistency in Source | | 译文相同而原文不同的多个句子 | | 6 | Inconsistency in Target | | 译文相同而原文不同的多个句子 | | 7 | Target Same as Source | | 原文和译文一样 | | 8 | Punctuation | | 存在连续两个及以上重复的标点符号(忽略省略号) | | 9 | Repeated Words | | 译文内存在连续重复两次或以上的单词 | | 10 | Multiple Whitespaces | | 译文内存在连续两个或以上空格(包括Tab健) | | 11 | Spelling | | 译文内存在拼写错误 | | 12 | Tag Mismatch | Tag标记对目前仅包括这样的XML格式标记对 | 原文和译文内的tag数量、名称不一致 | | 13 | Tag Error | | 译文中的标记对不成对的情况 | | 14 | Untranslated | | 漏译,即译文为空 | | 15 | Term Consistency | | 术语一致性检查,若原文某个单词出现在术语表,而译文不存在对应语种的术语,则报错。 | | 16 | MT Compare | | 提高BLEU测试集结果的客观性,将机器翻译结果与人工翻译结果比对,越相似,分数越高。 | | 17 | Length Ratio | | 原文和译文的单词长度的比例,返回一个浮点数。可以设置上下阈值来确定是否有问题。 | | 18 | Source Target Similarity | | 原文和译文的相似性。使用编辑距离来计算相似度。 | | 19 | Html Tags Check | | 检查原文或译文中是否有html标签,比如
    | | 20 | Html Escape Token Check | | 检查原文或译文中是否有html转义字符,比如   | | 21 | Large Token Check | | 超长单词检查,比如超过20个字符的单词 | | 22 | URL/Email/Order Number consistency check | | 原文和译文之间的URL、Email的一致性。 |