所有非标准编码的pdf均可使用此OCR软件转换。本软件转换英文文档效果很好,转换中文文档效果不佳。

    比如下面这个pdf,获取的文本是乱码的导致翻译故障。需要将这个pdf进行ocr转换后再翻译。
    20210127172040.png
    打开PDF XChange Editor。
    20210127172119.png
    软件左上角打开图标点击打开要转换的pdf文件。然后再“转换”选项卡-“识别页面” ,
    20210127172207.png
    这个页面需要注意选择正确的文档语言。这个是英文文档。选中默认的English。下拉中没有中文,如果是中文文档,需要点击右侧 添加/更新语言 下载中文OCR包。
    另外请去掉“忽略页面中存在的文本”的勾,如下图那样。
    其余按我下图框选的选择。
    20210127180735.png
    转换好后,点击保存按钮,保存转换好的pdf。
    20210127172512.png
    然后用知云文献翻译打开转换好的pdf,看正常了吧。
    20210127181016.png