GEO的supplementary files如果是ftp可直接wget下载
如果是http:
https://www.yuque.com/rulan/xfuhca/1653788169323
压缩文件处理
https://www.yuque.com/rulan/xfuhca/1653788561935
https://www.yuque.com/rulan/xfuhca/1653800760929
压缩文件解压缩后删除的第四种方法提到的,涉及到xargs,如下:
xargs实际上是让不能管道符传递变量的命令比如rm mv这些,也可以进行管道符传递,xargs -I files的files临时变量存储的就是管道符|前面的输出变量,再传递给mv rm等命令
xargs用法
https://www.yuque.com/rulan/xfuhca/1653789551181
xargs用于批量文件移动见下面
| txt.gz | read.table直接读取,不需解压 | |
| series_matrix_files | 下载后GEOquery::getGEO(file=””) | |
| .tar.gz | tar -zxvf | |
| tar | tar -xvf | |
| .gz | gzip -d | |
解压缩完毕后我们需要根据文件名字符串信息批量移动和整理文件:
https://www.yuque.com/rulan/xfuhca/1653789626879
注意正则表达式的运用:
https://www.yuque.com/rulan/xfuhca/1653805531959
对部分测序文件,在解压缩的时候发现会产生很多._前缀的的文件,删掉不影响,并且对于从matrix barcodes features构建Seurat对象,需要抽取一个文件夹检查里面有无隐藏文件,防止读取错误
构建方法
- 从matrix barcodes features构建
- 从txt构建
- 从h5构建
- 从下载下来的RDS文件构建,对本次实战数据来说,RDS是一个dgcMatrix,从文件结构看是Read10X以后的文件,那么找到作者上传的metadata,核对行名和counts的列名是否一致以后,就可以在CreateSeuratObject函数里面加一个meta.data参数放入metadata即可
在future::plan函数多线程运行时遇到报错:
Error: Fatal error: cannot create ‘R_TempDir’
退出rstudio server
ssl登录服务器
service rstudio-server stop
cd ..cd /tmpll# 看到很多Rtmp开头文件# 全部删掉service rstudio-server stop# 重新回到Rstudio server
