nohup "command" > out.file 2>&1 &
- ‘1’ 表示标准输出
- ‘2’ 标准错误
- “2>&1”表示标准输出和错误输出合并了。合并到哪里去呢?到 out.file 里。
- “>”覆盖写,“>>”追加写
- “&” 表示挂起,在后台运行
ps -ef |grep 关键字 |awk '{print $2}'|xargs kill -9
awk 工具可以很灵活地对文本进行处理,这里的 awk ‘{print $2}’是指第二列的内容,是运行的程序 ID。我们可以通过 xargs 传递给 kill -9,也就是发给这个运行的程序一个信号,让它关闭。
.bash_profile是系统配置信息存储文件,写在里面的系统变量是所有用户共用的,而.bashrc是个人的配置信息存储文件,只是单用户有效。也就是说,配置了.bashrc后切换用户可能需要重新配置系统变量。
进程管理
Linux 里,要创建一个新的进程,需要一个老的进程调用 fork 来实现,其中老的进程叫作父进程(Parent Process),新的进程叫作子进程(Child Process)。
对于 fork 系统调用的返回值,如果当前进程是子进程,就返回 0;如果当前进程是父进程,就返回子进程的进程号。这样首先在返回值这里就有了一个区分,然后通过 if-else 语句判断,如果是父进程,还接着做原来应该做的事情;如果是子进程,需要请求另一个系统调用 execve 来执行另一个程序,这个时候,子进程和父进程就彻底分道扬镳了,也即产生了一个分支(fork)了。
父进程要关心子进程的运行情况,有个系统调用waitpid,父进程可以调用它,将子进程的进程号作为参数传给它,这样父进程就知道子进程运行完了没有,成功与否。
内存管理
在操作系统中,每个进程都有自己的内存,互相之间不干扰,有独立的进程内存空间。
对于进程的内存空间来讲,放程序代码的这部分,我们称为代码段(Code Segment)。
对于进程的内存空间来讲,放进程运行中产生数据的这部分,我们称为数据段(Data Segment)。其中局部变量的部分,在当前函数执行的时候起作用,当进入另一个函数时,这个变量就释放了;也有动态分配的,会较长时间保存,指明才销毁的,这部分称为堆(Heap)。
一个进程的内存空间是很大的,32 位的是 4G,64 位的就更大了,我们不可能有这么多物理内存。就像一个公司的会议室是有限的,作为老板,你不可能事先都给项目组分配好。哪有这么多会议室啊,一定是需要的时候再分配。
两个在堆里面分配内存的系统调用,brk和mmap。
当分配的内存数量比较小的时候,使用 brk,会和原来的堆的数据连在一起,这就像多分配两三个工位,在原来的区域旁边搬两把椅子就行了。当分配的内存数量比较大的时候,使用 mmap,会重新划分一块区域,也就是说,当办公空间需要太多的时候,索性来个一整块。
文件管理
对于文件的操作,下面这六个系统调用是最重要的:
- 对于已经有的文件,可以使用open打开这个文件,close关闭这个文件;
- 对于没有的文件,可以使用creat创建文件;
- 打开文件以后,可以使用lseek跳到文件的某个位置;
- 可以对文件的内容进行读写,读的系统调用是read,写是write。
但是别忘了,Linux 里有一个特点,那就是一切皆文件。
- 启动一个进程,需要一个程序文件,这是一个二进制文件。
- 启动的时候,要加载一些配置文件,例如 yml、properties 等,这是文本文件;启动之后会打印一些日志,如果写到硬盘上,也是文本文件。
- 但是如果我想把日志打印到交互控制台上,在命令行上唰唰地打印出来,这其实也是一个文件,是标准输出stdout 文件。
- 这个进程的输出可以作为另一个进程的输入,这种方式称为管道,管道也是一个文件。
- 进程可以通过网络和其他进程进行通信,建立的Socket,也是一个文件。
- 进程需要访问外部设备,设备也是一个文件。
- 文件都被存储在文件夹里面,其实文件夹也是一个文件。
- 进程运行起来,要想看到进程运行的情况,会在 /proc 下面有对应的进程号,还是一系列文件。
每个文件,Linux 都会分配一个文件描述符(File Descriptor),这是一个整数。有了这个文件描述符,我们就可以使用系统调用,查看或者干预进程运行的方方面面。
信号处理
经常遇到的信号有以下几种:
- 在执行一个程序的时候,在键盘输入“CTRL+C”,这就是中断的信号,正在执行的命令就会中止退出;
- 非法访问内存
- 硬件故障,设备出了问题
- 用户进程通过kill函数,将一个用户信号发送给另一个进程。
对于一些不严重的信号,可以忽略,该干啥干啥,但是像 SIGKILL(用于终止一个进程的信号)和 SIGSTOP(用于中止一个进程的信号)是不能忽略的,可以执行对于该信号的默认动作。每种信号都定义了默认的动作,例如硬件故障,默认终止;也可以提供信号处理函数,可以通过sigaction系统调用,注册一个信号处理函数。
进程间通信
- 消息队列(Message Queue)
- 共享内存
首先就是发个消息,不需要一段很长的数据,这种方式称为消息队列**(Message Queue)。这个消息队列是在内核里的,我们可以通过msgget创建一个新的队列,msgsnd将消息发送到消息队列,而消息接收方可以使用msgrcv从队列中取消息。
当两个项目组需要交互的信息比较大的时候,可以使用共享内存的方式,这时候,我们可以通过shmget创建一个共享内存块,通过shmat将共享内存映射到自己的内存空间,然后就可以读写了。
但会存在“竞争”的问题。如果大家同时修改同一块数据咋办?这就需要有一种方式,让不同的人能够排他地访问,这就是信号量的机制Semaphore。
这个机制比较复杂,我这里说一种简单的场景。
对于只允许一个人访问的需求,我们可以将信号量设为 1。当一个人要访问的时候,先调用sem_wait。如果这时候没有人访问,则占用这个信号量,他就可以开始访问了。如果这个时候另一个人要访问,也会调用 sem_wait。由于前一个人已经在访问了,所以后面这个人就必须等待上一个人访问完之后才能访问。当上一个人访问完毕后,会调用sem_post将信号量释放,于是下一个人等待结束,可以访问这个资源了。
strace在linux下用来跟踪某个进程的系统调用
在solaris系统下,对应的是:dtrace
在mac系统下,对应的是:dtruss,极其难用
另外 pidof 很好用
