image.png

cat:Concatenate 查看文本文件的内容,输出到屏幕

常见参数:
-A## 打印所有内容,包括特殊字符,如制表符
-n## 打印出所有行号,-b参数仅打印非空白行行号
常见用法:cat >file cat file
其他:zcat:可以查看压缩的文本文件 tac:逆向查看

head / tail -n:查看文件的前/后n 行,默认10 行

less: 查看文件

less[参数] 文件名
常用参数:
-N:显示行号
-S:单行显示
zless:查看压缩文件
•上下左右键查看文本内容
•Enter键向下移动一行
•空格键翻页
•q键退出

wc:统计文本

常见参数:
-l 统计行数
-w 统计字符串数
-c 统计字节数

cut:文本切割

常见参数:
-d 指定分隔符,默认\t;
-f 输出哪几列(字段fields)

sort:排序

常见参数:
-n:按照数值从小到大进行排序
-V:字符串中含有数值时,按照数值从小到大排序
-r:逆向排序
-k:指定区域
-t:指定分隔符
106

uniq:去除重复行

常见参数:
-c:统计每个字符串连续出现的行数

paste:文本合并

常见参数:
-d:指定分隔符
-s:按行合并
常见用法:paste file1 file2 或 paste - -

tr:字符替换

常见参数:
-d:删除指定字符
-s:缩减连续重复字符

练习:

1.用less 查看example.gtf,然后管道符传递给wc

  1. $ less Data/example.gtf | wc
  2. 237 6944 77781

2.截取example.gtf第9 列的内容

$ less Data/example.gtf | cut -f 9

image.png

3.在第2步的基础上截取分号分割的第1列

$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1

image.png

4.在第3步的基础上排序、去重复并统计

$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1| sort |uniq -c

image.png

5.在第4步的基础上,将空格替换成制表符

$ less Data/example.gtf | cut -f 9|cut -d ";" -f 1| sort |uniq -c| tr " " '\t'| column -t

image.png

6. ~/Data/md5.txt原文件为制表符分割的两列:fastq_md5 和 fastq_aspera,每一列中又以分号为分割,分为2~3子列

$ less Data/md5.txt | cut -f 1| tr ";" "\n" > fastq_md5
$ less Data/md5.txt | cut -f 2| tr ";" "\n" > fastq_asqera
$ paste fastq_md5 fastq_asqera > md5_list
$ cat md5_list

image.png