什么是操作系统API
1、API是一些函数 ,这些函数是由Linux系统提供支持的,由应用层程序来使用
2、应用层序通过调用API来调用操作系统中的各种功能
3、学习一个操作系统,其实就是学习使用这个操作系统的API
Linux常用文件IO接口
open:用来打开文件<br />close:关闭文件<br />write:写文件<br />read:读文件<br />lseek:移动文件指针
文件操作的一般步骤,一般实先open打开一个文件,得到一个文件扫描述符,然后对文件进行读写操作(或其它操作),最后close关闭问价即可。
对文件进行操作时,一定要先打开文件,打开成功后才能去操作,最后读写完成后一定要close关闭文件,否则可能造成文件损坏。
静态文件:存放在块设备中的文件系统的文件。
当open一个文件时,Linux内核做的操作包括:内核在进程中建立了一个打开文件的数据结构,记录下我们打开的文件;内核在内存中申请一段内存,并且将静态文件的内容从块设备读取到内存中特定地址管理存放(叫动态文件)。
打开文件后,以后对这个文件的读写操作,都是针对内存中的这一份动态文件的,而并不是针对静态文件的。当我们对动态文件进行读写后,此时内存中的动态文件和块设备中的静态文件就不同步了,当我们close关闭动态文件时,close内部内核将内存中的动态文件的内容去更新(同步)块设备中的静态文件。
为什么要这么设计?
因为块设备本身有读写限制(NnadFlase、SD等块设备的读写特征),本身对块设备进行操作非常不灵活。而内存可以按字节为单位来操作,而且可以随机操作(内存就叫RAN,random),很灵活。所以内核设计文件操作时就这么设计了。
文件描述符
1、文件描述符其实是一个数字,这个数字在进程中表示一个特定的含义,当我们open打开一个文件时,操作系统在内存中构建了一些数据结构来表示这个动态文件,然后返回给应用程序一个数字作为文件描述符,这个数字就和我们内存中维护这个动态文件的这些数据挂钩绑定上了,以后我们应用程序如果要操作这一个动态文件,只需要用这个文件描述符进行区分。
文件描述符就是用来区分一个程序打开的多个文件
文件描述符的作用域就是当前进程,出了当前进程这个文件描述符就没有意义了。
Linux中的文件描述符fd的合法范围是0或者一个正整数。
open函数返回的文件描述符一定要记录好,以后像这个文件的所有操作都要靠这个文件描述符对应。
read函数
函数原型:
ssize_t read(int fd, void *buf, size_t count)
fd表示要读取哪个文件,fd一般由前面的open返回得到。
buf是应用程序自己提供的一段内存缓存区,用来存储读出的内容。
count是我们要读取的字节数。
返回值ssize_t类型是Linux内核用typedef重定义的一个类型,其实就是int,为了代码的可移植性,返回值表示成功读取的字节数。
向文件中写入
写入用write系统调用,write的原型和理解方法和read相似
注意buf的指针类型为void,也就是说buf可以是任意类型
exit、_exit、_Exit退出进程
正式终止进程应该使用exit、_exit、_Exit之一
errno和perror
errno就是error number,意思是错误号码。Linux系统中对各种常见错误做了个编号,当函数执行错误时,函数就会返回一个特定的errno编号来告诉我们这个函数哪里错了。
errno是由os来维护的一个全局变量,任何OS内部函数都可以通过设置errno来告诉上层调用者究竟发生了什么错误。
errno本身实质是一个int类型的数字,每个数字编号对应一种错误,Linux提供了一个函数perror(print error)。perror函数内部会读取errno并且将这个数字直接给转成对应的错误信息字符串,然后打印出来。
read和write的count
count和返回值的关系:count参数表示我们想要写或者读的字节数,返回值表示实际完成的要写或者读的字节数。实现的有可能等于想要读写的,也有可能小于(说明没有完成任务)。
count再和阻塞非阻塞结合起来就会更复杂。如果一个函数是阻塞的,则我们要读取30个,结果暂时只有20个就会被阻塞住,等待剩余的10个可以读。
有时候我们写正式程序时,我们要读取或者写入的是一个很庞大的文件(比如文件有2MB),我们不可能把count设置为210241024,而应该去把count设置为一个合适的数字(比如2048、4096),然后通过多次读取来实现全部读完。
