小知识点 - 知识_二进制方式和文本方式读取文件的区别 - 《【研发技术】》

首先要明白一点，就是无论你用哪种语言进行程序设计，也无论你用哪个函数进行文件操作（库函数也好，直接操作系统API也好），最终的文件打开的操作都是由操作系统来进行的，因此各种语言的情况从本质上来说都是相同的。

用二进制模式打开一个文件的时候，文件本身的内容和你编写程序时用函数读到的内容完全相同（或者说和磁盘上的内容完全相同）。

但是如果用了文本模式，那么操作系统在将文件内容传给上层程序（库函数，或者是你的程序）时，或者上层程序通过操作系统向文件写入内容时，操作系统都会预先进行一层预处理（或者说转义），具体过程依赖于操作系统的实现。

在Windows+VC下，最常见就是将回车符”\r\n“（没有引号，且\作转义符用，下同）解释成”\n“（读出时），将”\n“解释成”\r\n“（写入时）。而在Linux下没有这层转换，这也是Windows和Linux文本文件不通用的原因。

除此以外，两种打开方式其实是大同小异的。

举个例子，设有一文件 file.dat 内容为”ABC\r\nABC“，那么在下面的代码中，读到的内容将是”ABC\r\nABC“：

fp = fopen("file.dat","rb"); 
while(fgetc(fp)!=EOF);

而在下面的代码中，读到的内容却是”ABC\nABC“：

fp = fopen("file.dat","rt"); 
while(fgetc(fp)!=EOF);

还有一点要注意的是关于文件定位的问题。在文本模式下最好少用fseek，因为有了库函数的那层转义的存在，fseek会有一些近乎于奇怪的行为。我在Windows+VC下试验发现，尽管在文本模式下”\r\n“还是被当作两个字符计算的，但是当你把文件指针定位到”\r\n“处时，读到的两个字节都是”\n”。

C的文本方读写与二进制读写的差别仅仅体现在回车换行符的处理上

文本方式写时，每遇到一个’\n(0AH换行符)，它将其换成’\r\n(0D0AH，回车换行)，然后再写入文件；
文本方式读取时，它每遇到一个’\r\n将其反变化为’\n，然后送到读缓冲区

正因为文本方式有’\n－－’\r\n之间的转换，其存在转换耗时．二进制读写时，其不存在任何转换，直接将写缓冲区中数据写入文件．