我突然觉得,TBtools 应该有一个愿景,亦即:让数据分析成为一种享受,而不是折磨。

写在前面

在过去的一个月内,TBtools每天都在更新。而几乎所有更新都只有一个目的,那么就是进一步支持“BLAST Zone”。详细更新细节,可以在这一教程中体现出来。而教程的主题,我还是稍微想了一下,尽量贴合了具体数据分析常常出现的场景。
在我们拿到一个基因序列时,我们最感兴趣的或许就是这个基因到底具有什么功能,而对于编码基因,那么就是具体编码具有什么功能的蛋白。
要开展这一分析,最常规有效的做法就是,直接到 Uniprot 或者 NCBI ,随后 BlastP 或者 BlastX 到 Swissprot 数据库。
这两个平台一个在北美一个在欧洲,我们常常需要等待等待再等待,也不一定进得去。所以最好的做法就是,直接本地 BLAST 数据库。
整体操作步骤如下:

  1. 下载Swissprot的蛋白序列文件;
  2. 打开 TBtools 的 BLAST Zone 功能,导入该文件;
  3. 搞定,后续有待查的蛋白或者核酸序列,直接填入,点 Start 即可分析。

可以发现,非常简单。下面逐步详解。

下载Swissprot的蛋白序列文件

直接打开链接

  1. https://www.uniprot.org/downloads#uniprotkblink

可以看到 Swiss-Prot 字样,直接下载即可。
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图1
文件不大,大概是 86Mb,无需解压。
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图2

从 BLAST Zone 功能导入

打开 TBtools 并跳转到 BLAST Zone 功能
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图3
进入之后,按照下图新建一个数据库即可,
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图4
等待建库完成,即可看到
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图5
注:BLAST Zone 详细功能与具体使用可参考前述推文。

序列功能注释

接下来的内容就非常简单,只要想进行序列功能注释,无论是 1 个 还是 10000 个,直接放到 TBtools 里面,点击 Start 即可。(10以上的建议用文件模式输入)。
操作简单,如下图。几个序列,运行起来非常快(而且是 BLAST 原生,非常准确)
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图6
得到结果后
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图7

关于BLAST结果的快速文本浏览

事实上,过去一个月,在TBtools开发上投入的时间,基本就是在优化 Big Text View。这个功能看起来和 TBtools 没半毛钱关系,但是他却是重点。往往我们 BLAST得到的文件不一定很小。要快速打开和检索,事实上是需要时间的(后续会有更方便了完美的BLAST结果分析功能推出)。这里支持了一个文本检索操作。如下
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图8
我们只需要简单的双击该项目,文档会自动跳转到对应行
教程 | “美好体验”本地 BLAST 基因功能鉴定 - 图9

写在最后

咋说呢?有时候我们确实可能很长时间看不到进步,因为每一次进步,都很微小。但是呢,久而久之,就是很大的进步。如果用四字成语来说:滴水石穿,绳锯木断。