排序命令。
文件大小排序
不能用 -sh ,只能识别数字
du -s * | sort -nr
文本去重
简单去重
cat tmp.txt | sort -u > out.txt
大文本去重
LC_ALL=C sort -S 80% --parallel=60 -u input.txt > output.txt
- LC_ALL=C 意思是使用C的字符串比较方式,其实就是不对文件中的字节流进行字符解码,字符编解码是非常耗时的操作;
- -S 80% 即设置可用的内存,尽量设大;
- —parallel=60 六十个进程