命令行参数
C 语言程序可以从命令行接收参数。
$ ./foo hello world
上面示例中,程序foo接收了两个命令行参数hello和world。
程序内部怎么拿到命令行参数呢?C 语言会把命令行输入的内容,放在一个数组里面。main()函数的参数可以接收到这个数组。
#include <stdio.h>
int main(int argc, char* argv[]) {
for (int i = 0; i < argc; i++) {
printf("arg %d: %s\n", i, argv[i]);
}
}
上面示例中,main()函数有两个参数argc(argument count)和argv(argument variable)。这两个参数的名字可以任意取,但是一般来说,约定俗成就是使用这两个词。
第一个参数argc是命令行参数的数量,由于程序名也被计算在内,所以严格地说argc是参数数量 + 1。
第二个参数argv是一个数组,保存了所有的命令行输入,它的每个成员是一个字符串指针。
以./foo hello world为例,argc是3,表示命令行输入有三个组成部分:./foo、hello、world。数组argv用来获取这些输入,argv[0]是程序名./foo,argv[1]是hello,argv[2]是world。一般来说,argv[1]到argv[argc - 1]依次是命令行的所有参数。argv[argc]则是一个空指针 NULL。
由于字符串指针可以看成是字符数组,所以下面两种写法是等价的。
// 写法一
int main(int argc, char* argv[])
// 写法二
int main(int argc, char** argv)
另一方面,每个命令行参数既可以写成数组形式argv[i],也可以写成指针形式*(argv + i)。
利用argc,可以限定函数只能有多少个参数。
#include <stdio.h>
int main(int argc, char** argv) {
if (argc != 3) {
printf("usage: mult x y\n");
return 1;
}
printf("%d\n", atoi(argv[1]) * atoi(argv[2]));
return 0;
}
上面示例中,argc不等于3就会报错,这样就限定了程序必须有两个参数,才能运行。
另外,argv数组的最后一个成员是 NULL 指针(argv[argc] == NULL)。所以,参数的遍历也可以写成下面这样。
for (char** p = argv; *p != NULL; p++) {
printf("arg: %s\n", *p);
}
上面示例中,指针p依次移动,指向argv的每个成员,一旦移到空指针 NULL,就表示遍历结束。由于argv的地址是固定的,不能执行自增运算(argv++),所以必须通过一个中间变量p,完成遍历操作。
退出状态
C 语言规定,如果main()函数没有return语句,那么结束运行的时候,默认会添加一句return 0,即返回整数0。这就是为什么main()语句通常约定返回一个整数值,并且返回整数0表示程序运行成功。如果返回非零值,就表示程序运行出了问题。
Bash 的环境变量$?可以用来读取上一个命令的返回值,从而知道是否运行成功。
$ ./foo hello world
$ echo $?
0
上面示例中,echo $?用来打印环境变量$?的值,该值为0,就表示上一条命令运行成功,否则就是运行失败。
注意,只有main()会默认添加return 0,其他函数都没有这个机制。
环境变量
C 语言提供了getenv()函数(原型在stdlib.h)用来读取命令行环境变量。
#include <stdio.h>
#include <stdlib.h>
int main(void) {
char* val = getenv("HOME");
if (val == NULL) {
printf("Cannot find the HOME environment variable\n");
return 1;
}
printf("Value: %s\n", val);
return 0;
}
上面示例中,getenv(“HOME”)用来获取命令行的环境变量$HOME,如果这个变量为空(NULL),则程序报错返回。