Linux Shell输出文本中的指定行
在Linux系统上如何快速查看文本中指定行呢?有时文本较大比如有10w行,想要快速查看第99行该怎么做呢?
本文以文件名test.txt为例,介绍3种方式快速查看test.txt的第99行。相信你可以轻易的举一反三。
使用sed
sed全名:stream editor,流编辑器,使用程序的方式来编辑文本,可以实现替换、删除、新增、选取特定行等功能,是一种很hacker的方式。sed基本上使用正则表达式匹配,对正则表达式要求较高。
想要快速入门sed参考sed简明教程,想要深入学习参考sed完整手册。
sed语法格式:
sed [ -n ] [ -u ] Script [ File ... ]
sed [ -n ] [ -u ] [ -e Script ] ... [ -f ScriptFile ] ... [ File
... ]
关键Options介绍:
-n : 安静模式。一般sed用法中,所有来自STDIN的数据都会被输出到屏幕上,使用-n只有被sed处理的行才会列出来。如果不使用-n,使用sed打印时,会把输入流和处理的信息都打印一遍
a:append,追加文本
i:insert,插入文本
d:delete,删除文本
s: 模式匹配替换
p:打印文本
sed使用示例
在指定行插入或追加: a, i
a. 在test.txt第一行前插入:sed “1 i This is a test file” test.txt
b. 在test.txt最后一行追加:sed “$ a This is the end of file” test.txt
删除: d
a. 删除test.txt第二行: sed ‘2d’ test.txt
b. 删除test.txt符合正则表达式/fish的行: sed ‘/fish/d’ test.txt
修改文本:s
a. 将text.txt中love替换为like: sed “s/love/like/g” test.txt (/g表示全局匹配)
打印文本: p
a. 输出test.txt的第5-7行:sed -n ‘5,7p’ test.txt (-n的作用就显示出来了,可以去除-n查看效果)
ps: 以上命令并不会真的修改掉test.txt的内容,如果想修改文本内容可以使用重定向,或者使用-i选项。
使用sed输出test.txt的第99行?
有了以上的sed基础,可以轻易得出解决方案:sed -n ‘99,p’ test.txt。但sed在print后并不会立即退出,还会继续搜索文件直到文件末尾,当文件较大的时候使用sed的效率会比较低。可以做如下优化:sed -n ‘99,p;100q’ test.txt,打印完之后在100行退出。
使用awk
awk: 文本处理工具,可以在文件中查找与模式匹配的行并在这些行上执行指定的操作。awk比sed早诞生2-3年,作用与sed类似。快速入门awk可参考awk简明教程。
awk语法格式
awk [ -u ] [ -F Ere ] [ -v Assignment ] ... { -f ProgramFile |
'Program' } [ [ File ... | Assignment ... ] ] ...
awk提供了一系列内建变量:
$0: 当前记录(这个变量中存放着整个行的内容)
$1~$n: 当前记录的第n个字段,字段间由FS分隔
FS: 输入字段分隔符 默认是空格或Tab
NF: 当前记录中的字段个数,就是有多少列
NR: 已经读出的记录数,就是行号,从1开始,如果有多个文件话,这个值也是不断累加中。
FNR: 当前记录数,与NR不同的是,这个值会是各个文件自己的行号
RS: 输入的记录分隔符, 默认为换行符
OFS: 输出字段分隔符, 默认也是空格
ORS: 输出的记录分隔符,默认为换行符
FILENAME: 当前输入文件的名字
awk使用示例:
打印test.txt中第一列为This的行:awk ‘$1==”This” test.txt
打印表头和test.txt中第一列为This的行:awk ‘$1==”This” || NR == 1’ test.txt
格式化输出:awk ‘$1==”This” || NR==1 {printf “%-20s %-20s\n”,$4,$5}’ test.txt
使用awk输出test.txt的第99行?
使用内建变量NR和FNR:
awk ‘NR==99’ test.txt
awk ‘FNR==99’ test.txt
ps: awk打印完也不会立即退出,可以添加exit优化:awk ‘NR==99 {print; exit}’ test.txt
使用head和tail组合
head和tail故名思意,相对简单,分别输出文件或流的开头n行或结尾n行,就不在此详细介绍了。直接给出解决方案:
tail -n+99 test.txt|head -1
很容易想到对称的组合:head -99 test.txt|tail -1,但是当文件不足99行时,输出的是文件最后一行的内容。