参考:https://kaisery.github.io/trpl-zh-cn/ch12-00-an-io-project.html
一位 Rust 社区的成员,Andrew Gallant,已经创建了一个功能完整且非常快速的 grep 版本,叫做 ripgrep (rg)。相比之下,我们的 grep版本将非常简单,本章将教会你一些帮助理解像ripgrep 这样真实项目的背景知识。这帮助你回顾了目前为止的一些主要章节并涉及了如何在 Rust 环境中进行常规的 I/O 操作。通过使用命令行参数、文件、环境变量和打印错误的 eprintln! 宏。
我们的 grep 项目将会结合之前所学的一些内容:

另外还会简要的讲到闭包、迭代器和 trait 对象,他们分别会在 第十三章第十七章 中详细介绍。

构建代码的思路

  1. 分离出功能以便每个函数就负责一个任务。当函数承担了更多的功能就意味着承担更多责任,它就更难理解、测试,并且更难以在不破坏其他部分的情况下做出修改。
  2. 将配置变量组织进一个结构,这样就能使他们的目的更明确了。当作用域中有更多的变量时,将更难以追踪每个变量的目的。
  3. 把所有的错误处理都放于一处,这样将来的维护者在需要修改错误处理逻辑时就只需要考虑这一处代码,而且有助于确保我们打印的错误信息对终端用户来说是有意义的。

    二进制项目的构建原则

    main 函数负责多个任务的组织问题在许多二进制项目中很常见。所以 Rust 社区开发出一类在 main 函数开始变得庞大时进行二进制程序的 关注分离 (SOC) 的指导性过程。这些过程有如下步骤:
  • 将程序拆分成 main.rslib.rs 并将程序的逻辑放入 lib.rs 中。
  • 当命令行解析逻辑比较小时,可以保留在 main.rs 中。
  • 当命令行解析开始变得复杂时,也同样将其从 main.rs 提取到 lib.rs 中。

经过这些过程之后保留在 main 函数中的责任应该被限制为:

  • 使用参数值调用命令行解析逻辑
  • 设置任何其他的配置
  • 调用 lib.rs 中的 run 函数
  • 如果 run 返回错误,则处理这个错误

这个模式的一切就是为了关注分离:main.rs 处理程序运行,而 lib.rs 处理所有的真正的任务逻辑。因为不能直接测试 main 函数,这个结构通过将所有的程序逻辑移动到 lib.rs 的函数中使得我们可以测试他们。仅仅保留在 main.rs 中的代码将足够小以便阅读就可以验证其正确性。让我们遵循这些步骤来重构程序。

从简单的例子入手

在项目主目录下创建 poem.txt 文件(与 Cargo.toml 文件并列),其内容:

  1. I'm nobody! Who are you?
  2. Are you nobody, too?
  3. Then there's a pair of us - don't tell!
  4. They'd banish us, you know.
  5. How dreary to be somebody!
  6. How public, like a frog
  7. To tell your name the livelong day
  8. To an admiring bog!

src/main.rs 内容:

  1. use std::{env, fs};
  2. fn main() {
  3. let args: Vec<String> = env::args().collect(); // 命令行:cargo run the poem.txt
  4. let [query, filename] = parse_config(&args);
  5. let contents = fs::read_to_string(filename).expect("Something went wrong reading the file");
  6. println!("\nWith text:\n{}", contents);
  7. }
  8. fn parse_config(args: &Vec<String>) -> [&str; 2] {
  9. let query = &args[1];
  10. let filename = &args[2];
  11. println!("Searching for {:?}", query);
  12. println!("In file {:?}", filename);
  13. [query, filename]
  14. }

在 main 函数中放入程序的主体,利用函数、方法、甚至泛型等方式抽象和隐藏功能实现的具体过程。

借助类型系统关联数据

比如把配置变量放进元组或者数组,或者依靠相关的名称来关联变量,转换这种方式,让成结构体、枚举体描述数据,会让未来的维护者更容易理解不同的值如何相互关联以及他们的目的。
在复杂类型更为合适的场景下使用基本类型的反模式称为 基本类型偏执primitive obsession )。

  1. fn main() {
  2. let args: Vec<String> = env::args().collect();
  3. let (query, filename) = parse_config(&args);
  4. // --snip--
  5. }
  6. fn parse_config(args: &[String]) -> (&str, &str) {
  7. let query = &args[1];
  8. let filename = &args[2];
  9. (query, filename)
  10. }

把用户输入获取的配置放入 Config 结构体里(当然,也可以增加其他配置字段),然后充分利用结构体的特点,把 parse_config 这个仅与 Config 有关的函数变成其实例化的方法,这样可以打造具有默认配置的可变配置:

  1. fn main() {
  2. let args: Vec<String> = env::args().collect();
  3. let config = Config::new(&args);
  4. println!("Searching for {:?}", config.query);
  5. println!("In file {:?}", config.filename);
  6. let contents =
  7. fs::read_to_string(config.filename).expect("Something went wrong reading the file");
  8. println!("\nWith text:\n{}", contents);
  9. }
  10. struct Config {
  11. query: String,
  12. filename: String,
  13. }
  14. impl Config {
  15. fn new(args: &[String]) -> Self { // Self 用来指代当前结构体
  16. let query = args[1].clone();
  17. let filename = args[2].clone();
  18. Self { query, filename }
  19. }
  20. }

有许多不同的方式可以处理 String 的数据,而最简单但有些不太高效的方式是调用这些值的 clone 方法。这会生成 Config 实例可以拥有的数据的完整拷贝,不过会比储存字符串数据的引用消耗更多的时间和内存。不过拷贝数据使得代码显得更加直白因为无需管理引用的生命周期,所以在这种情况下牺牲一小部分性能来换取简洁性的取舍是值得的。
由于 clone 运行时消耗,许多 Rustacean 之间有一个趋势是倾向于避免使用 clone 来解决所有权问题。#todo: 迭代器# 更有效率的处理这种情况,不过现在,复制一些字符串来取得进展是没有问题的,因为只会进行一次这样的拷贝,而且文件名和要搜索的字符串都比较短。在第一轮编写时拥有一个可以工作但有点低效的程序要比尝试过度优化代码更好一些。随着你对 Rust 更加熟练,将能更轻松的直奔合适的方法,不过现在调用clone 是完全可以接受的。
运行程序:

  1. $ cargo run to poem.txt
  2. Compiling minigrep v0.1.0 (/home/ubuntu/scripts/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.40s
  4. Running `target/debug/minigrep to poem.txt`
  5. Searching for "to"
  6. In file "poem.txt"

改善错误提示信息

尝试不带任何参数运行程序,运行命令 cargo run,或出现 panic 信息 index out of bounds: the len is 1 but the index is 1,因为索引 args vector 时出现问题。这对于使用者来说并不能看懂因为什么出错——程序自身的问题,或者是使用者不恰当使用造成的。

  1. // 覆盖掉上面的 impl 块
  2. impl Config {
  3. fn new(args: &[String]) -> Self {
  4. if args.len() < 3 {
  5. panic!("not enough arguments");
  6. } // 检查 args 的长度至少是 3
  7. // 而函数的剩余部分则可以在假设这个条件成立的基础上运行
  8. let query = args[1].clone();
  9. let filename = args[2].clone();
  10. Self { query, filename }
  11. }
  12. }

再次运行命令 cargo run,程序依然 panic,但是对使用者来说,现在有了一个合理的错误信息,他们可以知道因为 not enough arguments 导致的。

  1. $ cargo run
  2. Compiling minigrep v0.1.0 (file:///projects/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs
  4. Running `target/debug/minigrep`
  5. thread 'main' panicked at 'not enough arguments', src/main.rs:26:13
  6. note: Run with `RUST_BACKTRACE=1` for a backtrace.

然而,还是有一堆额外的信息我们不希望提供给用户。panic! 的调用更趋向于程序上的问题而不是使用上的问题。
我们可以使用另一个技术 —— 返回一个可以表明成功或错误的 Result:

  1. use std::{env, fs, process};
  2. fn main() {
  3. let args: Vec<String> = env::args().collect();
  4. let config = Config::new(&args).unwrap_or_else(|err| {
  5. println!("Problem parsing arguments: {}", err);
  6. process::exit(1); // 该函数永远不会返回,并会立即终止当前进程。
  7. // 退出代码将传递到底层操作系统,并且可供其他进程使用。
  8. // 也不会运行当前堆栈或任何其他线程的堆栈上的析构函数
  9. });
  10. println!("Searching for {:?}", config.query);
  11. println!("In file {:?}", config.filename);
  12. let contents =
  13. fs::read_to_string(config.filename).expect("Something went wrong reading the file");
  14. println!("\nWith text:\n{}", contents);
  15. }
  16. struct Config {
  17. query: String,
  18. filename: String,
  19. }
  20. impl Config {
  21. fn new(args: &[String]) -> Result<Config, &'static str> {
  22. if args.len() < 3 {
  23. return Err("not enough arguments");
  24. }
  25. let query = args[1].clone();
  26. let filename = args[2].clone();
  27. Ok(Config { query, filename })
  28. }
  29. }

unwrap_or_else,它定义于标准库的 Result<T, E> 上(Option 上也被定义)。使用 unwrap_or_else 可以进行一些自定义的非panic!的错误处理。当 ResultOk 时,这个方法的行为类似于 unwrap:它返回 Ok 内部封装的值。然而,当其值是 Err 时,该方法会需要 函数或者 闭包closure ,匿名函数)作为参数。
现在运行命令 cargo run,报错信息对于用户来说就友好多了。

  1. $ cargo run
  2. Compiling minigrep v0.1.0 (file:///projects/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.48 secs
  4. Running `target/debug/minigrep`
  5. Problem parsing arguments: not enough arguments

还有一处使用了 expect 默认处理错误:read_to_string 方法返回 Result<String, Error>。现在修改这一处错误信息,让它提示更人性化,而不是让使用者看到冗长的 panic 信息。最终单个 main.rs 文件内的代码如下:

  1. use std::{env, error::Error, fs, process};
  2. fn main() {
  3. let args: Vec<String> = env::args().collect();
  4. let config = Config::new(&args).unwrap_or_else(|err| {
  5. println!("Problem parsing arguments: {}", err);
  6. process::exit(1);
  7. });
  8. println!("Searching for {:?}", config.query);
  9. println!("In file {:?}", config.filename);
  10. // `if let 模式 = 表达式` 语法可以用来处理 只匹配一个模式 的值而忽略其他模式的情况
  11. // 如果 `run` 返回 Ok 类型,正常处理完读取、打印文件,进行到 if let 时模式不匹配,主程序往下运行
  12. // 如果读取失败,返回 Err 类型,进入 if let 模式匹配,打印错误,主程序退出
  13. if let Err(e) = run(config) { // 这里的 e 类比 unwrap_or_else 里面的闭包参数 err
  14. println!("Application error: {}", e);
  15. process::exit(1);
  16. };
  17. }
  18. struct Config {
  19. query: String,
  20. filename: String,
  21. }
  22. impl Config {
  23. fn new(args: &[String]) -> Result<Config, &'static str> {
  24. if args.len() < 3 {
  25. return Err("not enough arguments");
  26. }
  27. let query = args[1].clone();
  28. let filename = args[2].clone();
  29. Ok(Config { query, filename })
  30. }
  31. }
  32. fn run(config: Config) -> Result<(), Box<dyn Error>> {
  33. // Box<dyn Error> 表示函数会返回实现了 Error trait 的类型,不过无需指定具体将会返回的值的类型。
  34. // 这使得 在不同的错误场景允许有不同类型的错误返回值,程序更加灵活。
  35. // dyn = dynamic
  36. let contents = fs::read_to_string(config.filename)?;
  37. println!("\nWith text:\n{}", contents);
  38. Ok(())
  39. }

尝试读取不存在的文件,可以看到自定义的输出提示:

  1. $ cargo run the file_not_exist.txt
  2. Compiling minigrep v0.1.0 (/home/ubuntu/scripts/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.43s
  4. Running `target/debug/minigrep the file_not_exist.txt`
  5. Searching for "the"
  6. In file "file_not_exist.txt"
  7. Application error: No such file or directory (os error 2)

例子中 if letunwrap_or_else 的函数体都一样:打印出错误并退出。它们代表两种方式,用于替换处理错误时简单粗暴的 unwrap 或者 except 方法。

main.rs 拆分进 lib.rs

我们知道,一个 “package” (也就是一个项目)可以允许一个 lib crate 和多个 binary crate。lib 和 binary 的 crate 名称就是项目主目录的名称(即与 package 同名)。而且”在 main.rs 中使用 use 把同名的 lib crate 的功能引入作用域”。

  1. // src/main.rs
  2. // minigrep 作为同名 lib crate,无需手动引入。但里面的功能为了减少名称长度,可以单独引入作用域
  3. use minigrep::Config;
  4. use std::{env, process}; // 不在当前文件中使用的功能无需引入,比如 error::Error, fs
  5. fn main() {
  6. let args: Vec<String> = env::args().collect();
  7. let config = Config::new(&args).unwrap_or_else(|err| {
  8. println!("Problem parsing arguments: {}", err);
  9. process::exit(1);
  10. });
  11. println!("Searching for {:?}", config.query);
  12. println!("In file {:?}", config.filename);
  13. if let Err(e) = minigrep::run(config) { // minigrep 默认被引入作用域
  14. println!("Application error: {}", e);
  15. process::exit(1);
  16. };
  17. }
  1. // src/lib.rs
  2. use std::{error::Error, fs}; // 不在当前文件中使用的功能无需引入,比如 env, process
  3. pub struct Config {
  4. pub query: String,
  5. pub filename: String,
  6. }
  7. impl Config {
  8. pub fn new(args: &[String]) -> Result<Config, &'static str> {
  9. if args.len() < 3 {
  10. return Err("not enough arguments");
  11. }
  12. let query = args[1].clone();
  13. let filename = args[2].clone();
  14. Ok(Config { query, filename })
  15. }
  16. }
  17. pub fn run(config: Config) -> Result<(), Box<dyn Error>> {
  18. let contents = fs::read_to_string(config.filename)?;
  19. println!("\nWith text:\n{}", contents);
  20. Ok(())
  21. }

至此,我们把 “冗长的 main.rs” 拆分成两个文件,而且利用 lib.rs 进行功能拓展,比如测试、编写新的核心代码。

测试驱动开发 (TTD)

测试驱动开发(Test Driven Development, TDD)的模式来逐步增加 minigrep 的搜索逻辑。这是一个软件开发技术,它遵循如下步骤:

  1. 编写一个失败的测试,并运行它以确保它失败的原因是你所期望的。
  2. 编写或修改足够的代码来使新的测试通过。
  3. 重构刚刚增加或修改的代码,即在实际的运行代码中调用编写好的函数,并确保测试仍然能通过。
  4. 从步骤 1 开始重复!

这只是众多编写软件的方法之一,不过 TDD 有助于驱动代码的设计。在编写能使测试通过的代码之前编写测试有助于在开发过程中保持高测试覆盖率。

增加搜索功能

查找包含传入的查询字符串所在的行,打印符合的行内容

  1. // src/lib.rs
  2. use std::{error::Error, fs};
  3. pub struct Config {
  4. pub query: String,
  5. pub filename: String,
  6. }
  7. impl Config {
  8. pub fn new(args: &[String]) -> Result<Config, &'static str> {
  9. if args.len() < 3 {
  10. return Err("not enough arguments");
  11. }
  12. let query = args[1].clone();
  13. let filename = args[2].clone();
  14. Ok(Config { query, filename })
  15. }
  16. }
  17. pub fn run(config: Config) -> Result<(), Box<dyn Error>> {
  18. let contents = fs::read_to_string(&config.filename)?;
  19. // println!("\nWith text:\n{}", contents);
  20. // 步骤 3
  21. for line in search(&config.query, &contents) {
  22. println!("{}", line);
  23. }
  24. Ok(())
  25. }
  26. // 步骤 2
  27. pub fn search<'a>(query: &str, contents: &'a str) -> Vec<&'a str> {
  28. let mut find: Vec<&str> = Vec::new();
  29. for line in contents.lines() {
  30. if line.contains(query) {
  31. find.push(line);
  32. }
  33. }
  34. find
  35. }
  36. // 步骤 1
  37. #[cfg(test)]
  38. mod tests {
  39. use super::*;
  40. #[test]
  41. fn one_result() {
  42. let query = "duct";
  43. let contents = "\
  44. Rust:
  45. safe, fast, productive.
  46. Pick three."; // `\` 符号表示去除换行,`\` 的下一行的内容接着 `\` 前的内容
  47. assert_eq!(vec!["safe, fast, productive."], search(query, contents));
  48. }
  49. }

支持大小写不敏感:参数方式

依然打印包含传入值所在的行。
使用环境变量CASE_INSENSITIVE来指定大小写不敏感,未指定时默认大小写敏感。

  1. // src/lib.rs
  2. use std::{env, error::Error, fs};
  3. #[derive(Debug)]
  4. pub struct Config {
  5. pub query: String,
  6. pub filename: String,
  7. pub case_sensitive: bool, // 增加一个配置字段
  8. }
  9. impl Config {
  10. pub fn new(args: &[String]) -> Result<Config, &'static str> {
  11. if args.len() < 3 {
  12. return Err("not enough arguments");
  13. }
  14. // 获取环境变量,注意这里的逻辑是 CASE_INSENSITIVE 存在于环境变量中,则认为不敏感
  15. // 无论 CASE_INSENSITIVE=0 还是等于任意数字、甚至任意字符,都认为是大小写不敏感
  16. // 这里这么做是为了简便
  17. let case_sensitive = env::var("CASE_INSENSITIVE").is_err(); // env::var 返回 Result 类型
  18. let query = args[1].clone();
  19. let filename = args[2].clone();
  20. Ok(Config {
  21. query,
  22. filename,
  23. case_sensitive,
  24. })
  25. }
  26. }
  27. pub fn run(config: Config) -> Result<(), Box<dyn Error>> {
  28. let contents = fs::read_to_string(&config.filename)?;
  29. let find = if config.case_sensitive {
  30. search(&config.query, &contents)
  31. } else {
  32. search_case_insensitive(&config.query, &contents)
  33. }; // 利用新增的 大小写敏感 字段值来选择哪种函数
  34. for line in find {
  35. println!("{}", line);
  36. }
  37. Ok(())
  38. }
  39. pub fn search<'a>(query: &str, contents: &'a str) -> Vec<&'a str> {
  40. let mut find: Vec<&str> = Vec::new();
  41. // line 必须严格包括 query 子串,所以这是大小写敏感的
  42. for line in contents.lines() {
  43. if line.contains(query) {
  44. find.push(line);
  45. }
  46. }
  47. find
  48. }
  49. // 新增一个支持大小写不敏感的函数,统一把不大小写敏感的内容转换成小写
  50. pub fn search_case_insensitive<'a>(query: &str, contents: &'a str) -> Vec<&'a str> {
  51. let mut find: Vec<&str> = Vec::new();
  52. let query_lower = query.to_lowercase();
  53. for line in contents.lines() {
  54. if line.to_lowercase().contains(&query_lower) {
  55. find.push(line);
  56. }
  57. }
  58. find
  59. }
  60. #[cfg(test)]
  61. mod tests {
  62. use super::*;
  63. #[test]
  64. fn case_sensitive() { // 原来不清楚的测试名称需要描述地更加清楚
  65. let query = "duct";
  66. let contents = "\
  67. Rust:
  68. safe, fast, productive.
  69. Pick three.
  70. Duct tape."; // 测试用例内容相应变化,体现出大小写敏感
  71. assert_eq!(vec!["safe, fast, productive."], search(query, contents));
  72. }
  73. #[test]
  74. fn case_insensitive() { // 新增一个大小写不敏感的测试
  75. let query = "rUsT";
  76. let contents = "\
  77. Rust:
  78. safe, fast, productive.
  79. Pick three.
  80. Trust me.";
  81. assert_eq!(
  82. vec!["Rust:", "Trust me."],
  83. search_case_insensitive(query, contents)
  84. );
  85. }
  86. }

运行程序:
大小写不敏感(存在 CASE_INSENSITIVE 环境变量)

  1. $ CASE_INSENSITIVE=1 cargo run to poem.txt
  2. Compiling minigrep v0.1.0 (/home/ubuntu/scripts/minigrep)
  3. Finished dev [unoptimized + debuginfo] target(s) in 0.40s
  4. Running `target/debug/minigrep to poem.txt`
  5. Searching for "to"
  6. In file "poem.txt"
  7. Are you nobody, too?
  8. How dreary to be somebody!
  9. To tell your name the livelong day
  10. To an admiring bog!

大小写敏感 (无 CASE_INSENSITIVE 环境变量)

  1. $ cargo run to poem.txt
  2. Finished dev [unoptimized + debuginfo] target(s) in 0.01s
  3. Running `target/debug/minigrep to poem.txt`
  4. Searching for "to"
  5. In file "poem.txt"
  6. Are you nobody, too?
  7. How dreary to be somebody!

支持大小写不敏感:环境变量

也可以使用命令行参数来指定不敏感,比如 -i 表示 大小写不敏感 (case insensitive),-I 表示 大小写敏感 (因为强调了大写),那么修改一下 Config::new 方法即可:

  1. // src/lib.rs
  2. // 下面覆盖相应的代码
  3. impl Config {
  4. pub fn new(args: &[String]) -> Result<Config, &'static str> {
  5. if args.len() < 4 {
  6. return Err("not enough arguments");
  7. }
  8. let case_sensitive = match args[1].as_str() {
  9. "-i" => false,
  10. "-I" => true,
  11. _ => true,
  12. };
  13. let query = args[2].clone(); ‣query: String
  14. let filename = args[3].clone(); ‣filename: String
  15. Ok(Config {
  16. query,
  17. filename,
  18. case_sensitive,
  19. })
  20. }
  21. }

由于 -i 之类带 - 的参数直接跟在 cargo run 命令会产生冲突,所以先编译,然后手动指定运行 minigrep 程序:

  1. $ cargo build
  2. $ ./target/debug/minigrep -i to poem.txt # 大小写不敏感
  3. Searching for "to"
  4. In file "poem.txt"
  5. Are you nobody, too?
  6. How dreary to be somebody!
  7. To tell your name the livelong day
  8. To an admiring bog!
  9. $ ./target/debug/minigrep -I to poem.txt # 大小写敏感
  10. Searching for "to"
  11. In file "poem.txt"
  12. Are you nobody, too?
  13. How dreary to be somebody!
  14. $ ./target/debug/minigrep to poem.txt # 必须传入三个参数
  15. Problem parsing arguments: not enough arguments

依然可以改进,第 1 个参数是 - 开头的字符串时被识别是控制搜索方式的参数;第 1 个参数不已 - 开头,则任务以大小写敏感方式接受查询值和查询文件。如此便可以输入两个或者三个参数都能运行:

  1. // src/lib.rs
  2. // 下面覆盖相应的代码
  3. impl Config {
  4. pub fn new(args: &[String]) -> Result<Config, &'static str> {
  5. if args.len() < 3 {
  6. return Err("not enough arguments");
  7. }
  8. let mut args = args.to_vec();
  9. let case_sensitive = if args[1].starts_with("-") {
  10. match args.remove(1).as_str() {
  11. "-i" => false,
  12. "-I" => true,
  13. _ => true, // 这里需要做成错误处理,或者识别其他传入的参数
  14. }
  15. } else {
  16. true
  17. };
  18. let query = args[1].clone();
  19. let filename = args[2].clone();
  20. Ok(Config {
  21. query,
  22. filename,
  23. case_sensitive,
  24. })
  25. }
  26. }

运行程序:

  1. $ cargo build
  2. $ ./target/debug/minigrep to poem.txt # 可以传入两个参数时默认大小写敏感
  3. Searching for "to"
  4. In file "poem.txt"
  5. Are you nobody, too?
  6. How dreary to be somebody!

处理环境变量与参数之间的冲突

一些程序允许对相同配置同时使用参数 和 环境变量。在这种情况下,程序来决定参数和环境变量的优先级。
笔者修改了 Config::new 方法,支持:

  • 环境变量 CASE_INSENSITIVE=1 时被认为是大小写不敏感,其他值都表示大小写敏感
  • 环境变量和参数都存在时,以参数为准。 ``` // src/lib.rs // 下面覆盖相应的代码 impl Config { pub fn new(args: &[String]) -> Result<Config, &’static str> {

    1. if args.len() < 3 {
    2. return Err("not enough arguments");
    3. }
    4. let mut args = args.to_vec();
    5. let case_sensitive = if args[1].starts_with("-") {
    6. match args.remove(1).as_str() {
    7. "-i" => false,
    8. "-I" => true,
    9. _ => true, // 这里可以做成错误处理,或者识别其他传入的参数
    10. }
    11. } else {
    12. match env::var("CASE_INSENSITIVE") {
    13. // 当 CASE_INSENSITIVE=1 时才被认为是大小不敏感
    14. Ok(s) if s == 1.to_string() => false,
    15. _ => true,
    16. }
    17. };
    18. let query = args[1].clone();
    19. let filename = args[2].clone();
    20. Ok(Config {
    21. query,
    22. filename,
    23. case_sensitive,
    24. })

    } }

  1. [重构了测试代码](https://gitee.com/ZIP97/minigrep/tree/v0.1/tests):

$ cargo test running 6 tests test tests_case_sens::case_insensitive_conflict … ok test tests_case_sens::case_insensitive_env_var … ok test tests_case_sens::case_insensitive_no_env_var … ok test tests_case_sens::case_sensitive_conflict … ok test tests_search::case_insensitive … ok test tests_search::case_sensitive … ok

test result: ok. 6 passed; 0 failed; 0 ignored; 0 measured; 0 filtered out; finished in 0.00s

  1. 最终项目内容见:[https://gitee.com/ZIP97/minigrep/tree/v0.1](https://gitee.com/ZIP97/minigrep/tree/v0.1),二进制软件运行情况:

$ cargo build

$ ./target/debug/minigrep # 提示友好,而不是 panic 信息 Problem parsing arguments: not enough arguments

$ ./target/debug/minigrep to poem.txt # 不强制输入参数 Are you nobody, too? How dreary to be somebody!

$ ./target/debug/minigrep -i to poem.txt # 支持参数 Are you nobody, too? How dreary to be somebody! To tell your name the livelong day To an admiring bog!

$ CASE_INSENSITIVE=1 ./target/debug/minigrep to poem.txt # 支持环境变量 Are you nobody, too? How dreary to be somebody! To tell your name the livelong day To an admiring bog!

$ CASE_INSENSITIVE=1 ./target/debug/minigrep -i to poem.txt # 支持环境变量与参数共存 Are you nobody, too? How dreary to be somebody! To tell your name the livelong day To an admiring bog!

$ CASE_INSENSITIVE=0 ./target/debug/minigrep -I to poem.txt # 支持环境变量与参数共存 Are you nobody, too? How dreary to be somebody!

$ CASE_INSENSITIVE=0 ./target/debug/minigrep -i to poem.txt # 环境变量与参数冲突时,参数优先 Are you nobody, too? How dreary to be somebody! To tell your name the livelong day To an admiring bog!

$ CASE_INSENSITIVE=1 ./target/debug/minigrep -I to poem.txt # 环境变量与参数冲突时,参数优先 Are you nobody, too? How dreary to be somebody!

  1. ## 程序结果输出到文件 与 `stderr`
  2. 目前为止,我们将所有的输出都 `println!` 到了终端。大部分终端都提供了两种输出:
  3. |
  4. | stdout
  5. | stderr
  6. |
  7. | --- | --- | --- |
  8. |
  9. Rust
  10. | `println!`
  11. | `eprintln!`
  12. |
  13. |
  14. 不输出到文件时
  15. | 正常打印
  16. | 正常打印
  17. |
  18. |
  19. 使用 `>` 输出到文件
  20. | 支持
  21. | 不支持
  22. |
  23. |
  24. 输出到文件时
  25. | 覆盖/创建输出的文件,把打印的内容写入文件,打印内容不再显示
  26. | 覆盖/创建输出的文件,不会把打印的内容写入文件,打印内容正常显示
  27. |
  28. - **标准输出** _standard output_ `stdout`)对应一般信息,除了正常打印之外,如果在终端命令的最后使用 `> output.txt` 把原本正常打印的内容输出到文件,此时终端不显示打印内容。Rust 中使用 `println!` 宏。
  29. - **标准错误** _standard error_ `stderr`)则用于打印错误信息,只能打印,无法输出内容到文件。即使在运行命令后面添加了 `> output.txt` 命令,也不会把内容输出到文件,仅仅是创建/覆盖 output.txt 文件而已。Rust 中使用 `eprintln!` 宏。
  30. 让我们最后对 `src/main.rs` 做调整:如果程序正常运行,运行结果输出成文件;如果运行错误,打印错误信息,输出文件为空

// src/main.rs use minigrep::Config; use std::{env, process};

fn main() { let args: Vec = env::args().collect();

  1. let config = Config::new(&args).unwrap_or_else(|err| {
  2. eprintln!("Problem parsing arguments: {}", err);
  3. process::exit(1);
  4. });
  5. // 删除了打印查询文字和查询文件的信息
  6. if let Err(e) = minigrep::run(config) {
  7. eprintln!("Application error: {}", e); // 这是 stderr ,不会输出到文件
  8. process::exit(1);
  9. };

}

  1. 程序正常运行并输出到文件:

$ cargo build

$ ./target/debug/minigrep to poem.txt > output.txt

$ cat output.txt Are you nobody, too? How dreary to be somebody!

  1. 程序错误时打印,输出文件为空:

$ ./target/debug/minigrep > output.txt Problem parsing arguments: not enough arguments $ cat output.txt

```