cat:Concatenate 查看文本文件的内容,输出到屏幕
常见参数:
-A## 打印所有内容,包括特殊字符,如制表符
-n## 打印出所有行号,-b参数仅打印非空白行行号
常见用法:cat >file cat file
其他:zcat:可以查看压缩的文本文件 tac:逆向查看
head / tail -n:查看文件的前/后n 行,默认10 行
less: 查看文件
less[参数] 文件名
常用参数:
-N:显示行号
-S:单行显示
zless:查看压缩文件
•上下左右键查看文本内容
•Enter键向下移动一行
•空格键翻页
•q键退出
wc:统计文本
cut:文本切割
常见参数:
-d 指定分隔符,默认\t;
-f 输出哪几列(字段fields)
sort:排序
常见参数:
-n:按照数值从小到大进行排序
-V:字符串中含有数值时,按照数值从小到大排序
-r:逆向排序
-k:指定区域
-t:指定分隔符
106
uniq:去除重复行
paste:文本合并
常见参数:
-d:指定分隔符
-s:按行合并
常见用法:paste file1 file2 或 paste - -
tr:字符替换
练习:
1.用less 查看example.gtf,然后管道符传递给wc
$ less Data/example.gtf | wc
237 6944 77781
2.截取example.gtf第9 列的内容
$ less Data/example.gtf | cut -f 9
3.在第2步的基础上截取分号分割的第1列
$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1
4.在第3步的基础上排序、去重复并统计
$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1| sort |uniq -c
5.在第4步的基础上,将空格替换成制表符
$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1| sort |uniq -c| tr " " '\t'| column -t
6. ~/Data/md5.txt原文件为制表符分割的两列:fastq_md5 和 fastq_aspera,每一列中又以分号为分割,分为2~3子列
$ less Data/md5.txt | cut -f 1| tr ";" "\n" > fastq_md5
$ less Data/md5.txt | cut -f 2| tr ";" "\n" > fastq_asqera
$ paste fastq_md5 fastq_asqera > md5_list
$ cat md5_list