由于知云文献翻译原理是当你选中pdf中的文字的时候,软件给你复制出来,并提交给翻译引擎。有些pdf复制出来的文字是乱码的或空格丢失的,或者有些扫描件制作而成的pdf甚至完全无法选中。这些pdf都会导致无法翻译。解决方法是用OCR软件转换识别这类pdf成标准格式的pdf,然后再使用知云文献翻译阅读翻译。
004-乱码,空格丢失,无法选中文字等非标准pdf请OCR转换后使用 - 图1

MAC系统中建议使用下面这款OCR软件。(这里请注意,“OCR软件”是一类软件的统称,而不是一个软件)

1、先下载这款软件dmg安装包。

微信关注下面“艾米的科研宝库”公众号,并在公众号下回复关键词“1768”,注意是红色的数字部分。会立即得到这款mac下使用的OCR软件下载地址。软件是不需要注册,不需要购买直接可以使用的版本。
004-乱码,空格丢失,无法选中文字等非标准pdf请OCR转换后使用 - 图2

2、双击下载下来的dmg安装包,开始安装程序

安装方法看下图。
20210124155925.png
20210124160059.png
20210124160123.png

3-打开软件,开始使用

看到finder中应用程序中的上面框住的图标了吗,双击它。打开程序后首先设置下语言,因为大部分人都是阅读英文文献,所以把文档语言设置为“英文”。意思是待会软件打开需要OCR转换的pdf的时候,软件会把它当成英文文档去识别其中的文字。如果你是中文pdf,你就选择“中文”即可。
20210124160210.png
20210124160341.png
20210124160455.png
20210124160612.png
20210124160654.png

4-保存你OCR转换好的pdf文档。

请务必记住你保存到电脑中哪个地方了哦。用知云文献翻译或者你的其他pdf阅读器打开你ocr转换后的pdf文件就正常了。
20210124160715.png
20210124160757.png

5-如果要OCR转换另外一个PDF文件

请如下,点击“新建”图标,然后询问你是否删除当前打开的文档,点击“是”。软件会开一个新的项目,然后你再点击“文件”按钮打开另外的pdf文件即可。请不要直接点击“文件”按钮,否则软件会把你将要打开的pdf文件和之前已经转换过的pdf合并成一个pdf。
20210124160950.png