文本提取工具
文件内容:cat, more 和 less
文件摘选:head 和 tail
按关键字提取:grep
提取列或者字段:cut
cat, more, less 查看文本内容
cat :打印一个或者多个文件到标准输出,对于大文件不适用,-n输出行号
more:浏览文件内容,每次只看一页,按空格翻页
less:浏览文件内容,每次只看一页
常用命令如下:
-/text:搜索 text
-n/N:跳转到next/previous匹配的地方
-v:用文本编辑器打开该文件
head, tail 过滤文本内容
head: 显示文件的起始10行,使用-n选项来指定显示的行
tail:显示文件的最后10行,使用-n选项指定显示的行,使用-f选项将文件末尾追加的内容显示在当前终端。 
附:使用grep来更改网页,grep -r string FILE
cut提取列或者字段
cut -d ":" -f1,6 /etc/passwd提取以:作为分隔符的第一列到第六列来输出
使用-c来按照字符来进行提取。
1.用grep按行提取,找到唯一的关键字
2. 用cut来提取列,要判断所取行的规律,找到分隔符
awk工具
-F就是分隔符,用“”引起来,这个工具天生就是以空格作为分隔符。
文本分析工具
文本统计工具:wc
默认用来统计单词数,行数,字节数,和字符数。可以真对一个文件和标准输入
-l 统计行数,-w统计单词数,-c统计字节数
统计输出内容有多少行ls -l FILE | wc -c
文本排序工具:sort
sort [options] file(s)
按照ascll码来进行排序,主要对第一位进行排序
sort可以去掉不连续重复的行,uniq只能去掉连续重复的行。cat txt | sort | uniq sort|uniq组合排序去重,经常用uniq -c txt统计txt文本里面重复的次数
lastb检查曾经登陆失败的人,批量导入ip地址到文本
文本比较工具:diff,vimdiff
diff FILE1 FILE2
用于 比较两个文件的不同,并指出差异在第几行。vimdiff FILE1 FILE2
直接产生两个窗口进行对照对比,还能够直接编辑,更加实用。
文本操作工具
文本转换工具:tr
不会保留到文件里面
1.转换一种字符集合为另外一种字符集合
2.只能从stdin读取数据tr 'a-z' 'A-Z' < lowercase.txt
3.tr -d char删除掉指定的字符
更改字符串:sed
1.流编辑器:操作会作用到每一行
2.执行查找/替换 操作在文本流上
3.通常不改变原文件
4.使用-i.bak备份和修改原文件,会留下一个.bak文件来备份
**
基本正则表达式
特殊的字符拥有特殊的意义
扩展正则表达式

