在第二个教程中,我们学习了如何使用工作队列在多个worker之间分配耗时的任务。
但是,如果我们需要在远程计算机上运行函数并等待结果怎么办?好吧,那是一个不同的故事。这种模式通常称为远程过程调用RPC
在本教程中,我们将使用RabbitMQ构建一个RPC系统:客户端和可伸缩RPC服务器。由于我们没有值得分配的耗时任务,因此我们将创建一个虚拟RPC服务,该服务返回斐波那契数。

有关RPC的说明 尽管RPC是计算中非常常见的模式,但它经常受到批评。 当程序员不知道函数调用是本地的还是缓慢的RPC时,就会出现问题。这样的混乱会导致系统变幻莫测,并给调试增加了不必要的复杂性。滥用RPC可能会导致无法维护的意大利面条式代码而不是简化软件, 牢记这一点,请考虑以下建议:

  • 确定哪个函数调用是本地的,哪个是远程的。
  • 为你的系统编写文档。明确组件之间的依赖关系。
  • 处理错误情况。 当RPC服务器长时间关闭时,客户端应如何处理?

回调队列

通常,通过RabbitMQ进行RPC很容易。客户端发送请求消息,服务器发送响应消息。为了接收响应,我们需要发送带有“回调”队列地址的请求。我们可以使用默认队列。让我们尝试一下:

  1. q, err := ch.QueueDeclare(
  2. "", // 不指定队列名,默认使用随机生成的队列名
  3. false, // durable
  4. false, // delete when unused
  5. true, // exclusive
  6. false, // noWait
  7. nil, // arguments
  8. )
  9. err = ch.Publish(
  10. "", // exchange
  11. "rpc_queue", // routing key
  12. false, // mandatory
  13. false, // immediate
  14. amqp.Publishing{
  15. ContentType: "text/plain",
  16. CorrelationId: corrId,
  17. ReplyTo: q.Name, // 在这里指定callback队列名,也是在这个队列等回复
  18. Body: []byte(strconv.Itoa(n)),
  19. })

消息属性 AMQP 0-9-1协议预定义了消息附带的14个属性集。除以下属性外,大多数属性很少使用:

  • persistent:将消息标记为持久性(值为true)或瞬态(false)。你可能还记得第二个教程中的此属性。
  • content_type:用于描述编码的mime类型。例如,对于经常使用的JSON编码,将此属性设置为application/ json是一个好习惯。
  • reply_to:常用于命名回调队列
  • correlation_id:有助于将RPC响应与请求相关联

关联ID(Correlation Id)

在上面介绍的方法中,我们建议为每个RPC请求创建一个回调队列。这是相当低效的,但是幸运的是,有一种更好的方法——让我们为每个客户端创建一个回调队列。
这就引发了一个新问题,在该队列中收到响应后,尚不清楚响应属于哪个请求。这个时候就该使用correlation_id这个属性了。针对每个请求我们将为其设置一个唯一值。随后,当我们在回调队列中收到消息时,我们将查看该属性,并基于这个属性将响应与请求进行匹配。如果我们看到未知的correlation_id值,则可以放心地丢弃该消息——它不属于我们的请求。
你可能会问,为什么我们应该忽略回调队列中的未知消息,而不是报错而失败?这是由于服务器端可能出现竞争状况。尽管可能性不大,但RPC服务器可能会在向我们发送答案之后但在发送请求的确认消息之前死亡。如果发生这种情况,重新启动的RPC服务器将再次处理该请求。这就是为什么在客户端上我们必须妥善处理重复的响应,并且理想情况下RPC应该是幂等的。

总结

RPC - 图1
我们的RPC工作流程如下:

  • 客户端启动时,它将创建一个匿名排他回调队列。
  • 对于RPC请求,客户端发送一条消息,该消息具有两个属性:reply_to(设置为回调队列)和correlation_id(设置为每个请求的唯一值)。
  • 该请求被发送到rpc_queue队列。
  • RPC工作程序(又名:服务器)正在等待该队列上的请求。当出现请求时,它会完成计算工作并把结果作为消息使用replay_to字段中的队列发回给客户端。
  • 客户端等待回调队列上的数据。出现消息时,它将检查correlation_id属性。如果它与请求中的值匹配,则将响应返回给应用程序。

    完整示例

    斐波那契函数:

    1. func fib(n int) int {
    2. if n == 0 {
    3. return 0
    4. } else if n == 1 {
    5. return 1
    6. } else {
    7. return fib(n-1) + fib(n-2)
    8. }
    9. }

    声明我们的斐波那契函数。它仅假设有效的正整数输入。 (不要指望这种方法适用于大量用户,它可能是最慢的递归实现)。
    我们的RPC服务器rpc_server.go的代码如下所示:

    1. package main
    2. import (
    3. "log"
    4. "strconv"
    5. "github.com/streadway/amqp"
    6. )
    7. func failOnError(err error, msg string) {
    8. if err != nil {
    9. log.Fatalf("%s: %s", msg, err)
    10. }
    11. }
    12. func fib(n int) int {
    13. if n == 0 {
    14. return 0
    15. } else if n == 1 {
    16. return 1
    17. } else {
    18. return fib(n-1) + fib(n-2)
    19. }
    20. }
    21. func main() {
    22. conn, err := amqp.Dial("amqp://guest:guest@localhost:5672/")
    23. failOnError(err, "Failed to connect to RabbitMQ")
    24. defer conn.Close()
    25. ch, err := conn.Channel()
    26. failOnError(err, "Failed to open a channel")
    27. defer ch.Close()
    28. q, err := ch.QueueDeclare(
    29. "rpc_queue", // name
    30. false, // durable
    31. false, // delete when unused
    32. false, // exclusive
    33. false, // no-wait
    34. nil, // arguments
    35. )
    36. failOnError(err, "Failed to declare a queue")
    37. err = ch.Qos(
    38. 1, // prefetch count
    39. 0, // prefetch size
    40. false, // global
    41. )
    42. failOnError(err, "Failed to set QoS")
    43. msgs, err := ch.Consume(
    44. q.Name, // queue
    45. "", // consumer
    46. false, // auto-ack
    47. false, // exclusive
    48. false, // no-local
    49. false, // no-wait
    50. nil, // args
    51. )
    52. failOnError(err, "Failed to register a consumer")
    53. forever := make(chan bool)
    54. go func() {
    55. for d := range msgs {
    56. n, err := strconv.Atoi(string(d.Body))
    57. failOnError(err, "Failed to convert body to integer")
    58. log.Printf(" [.] fib(%d)", n)
    59. response := fib(n)
    60. err = ch.Publish(
    61. "", // exchange
    62. d.ReplyTo, // routing key
    63. false, // mandatory
    64. false, // immediate
    65. amqp.Publishing{
    66. ContentType: "text/plain",
    67. CorrelationId: d.CorrelationId,
    68. Body: []byte(strconv.Itoa(response)),
    69. })
    70. failOnError(err, "Failed to publish a message")
    71. d.Ack(false)
    72. }
    73. }()
    74. log.Printf(" [*] Awaiting RPC requests")
    75. <-forever
    76. }

    服务器代码非常简单:

  • 与往常一样,我们首先建立连接,通道并声明队列。

  • 我们可能要运行多个服务器进程。为了将负载平均分配给多个服务器,我们需要在通道上设置prefetch设置。
  • 我们使用Channel.Consume获取去队列,我们从队列中接收消息。然后,我们进入goroutine进行工作,并将响应发送回去。

我们的RPC客户端rpc_client.go的代码:

  1. package main
  2. import (
  3. "log"
  4. "math/rand"
  5. "os"
  6. "strconv"
  7. "strings"
  8. "time"
  9. "github.com/streadway/amqp"
  10. )
  11. func failOnError(err error, msg string) {
  12. if err != nil {
  13. log.Fatalf("%s: %s", msg, err)
  14. }
  15. }
  16. func randomString(l int) string {
  17. bytes := make([]byte, l)
  18. for i := 0; i < l; i++ {
  19. bytes[i] = byte(randInt(65, 90))
  20. }
  21. return string(bytes)
  22. }
  23. func randInt(min int, max int) int {
  24. return min + rand.Intn(max-min)
  25. }
  26. func fibonacciRPC(n int) (res int, err error) {
  27. conn, err := amqp.Dial("amqp://guest:guest@localhost:5672/")
  28. failOnError(err, "Failed to connect to RabbitMQ")
  29. defer conn.Close()
  30. ch, err := conn.Channel()
  31. failOnError(err, "Failed to open a channel")
  32. defer ch.Close()
  33. q, err := ch.QueueDeclare(
  34. "", // name
  35. false, // durable
  36. false, // delete when unused
  37. true, // exclusive
  38. false, // noWait
  39. nil, // arguments
  40. )
  41. failOnError(err, "Failed to declare a queue")
  42. msgs, err := ch.Consume(
  43. q.Name, // queue
  44. "", // consumer
  45. true, // auto-ack
  46. false, // exclusive
  47. false, // no-local
  48. false, // no-wait
  49. nil, // args
  50. )
  51. failOnError(err, "Failed to register a consumer")
  52. corrId := randomString(32)
  53. err = ch.Publish(
  54. "", // exchange
  55. "rpc_queue", // routing key
  56. false, // mandatory
  57. false, // immediate
  58. amqp.Publishing{
  59. ContentType: "text/plain",
  60. CorrelationId: corrId,
  61. ReplyTo: q.Name,
  62. Body: []byte(strconv.Itoa(n)),
  63. })
  64. failOnError(err, "Failed to publish a message")
  65. for d := range msgs {
  66. if corrId == d.CorrelationId {
  67. res, err = strconv.Atoi(string(d.Body))
  68. failOnError(err, "Failed to convert body to integer")
  69. break
  70. }
  71. }
  72. return
  73. }
  74. func main() {
  75. rand.Seed(time.Now().UTC().UnixNano())
  76. n := bodyFrom(os.Args)
  77. log.Printf(" [x] Requesting fib(%d)", n)
  78. res, err := fibonacciRPC(n)
  79. failOnError(err, "Failed to handle RPC request")
  80. log.Printf(" [.] Got %d", res)
  81. }
  82. func bodyFrom(args []string) int {
  83. var s string
  84. if (len(args) < 2) || os.Args[1] == "" {
  85. s = "30"
  86. } else {
  87. s = strings.Join(args[1:], " ")
  88. }
  89. n, err := strconv.Atoi(s)
  90. failOnError(err, "Failed to convert arg to integer")
  91. return n
  92. }

现在是时候看看rpc_client.gorpc_server.go的完整示例源代码了。
我们的RPC服务现已准备就绪。我们可以启动服务器:

  1. go run rpc_server.go
  2. # => [x] Awaiting RPC requests

要请求斐波那契数,请运行客户端:

  1. go run rpc_client.go 30
  2. # => [x] Requesting fib(30)

这里介绍的设计不是RPC服务的唯一可能的实现,但是它具有一些重要的优点:

  • 如果RPC服务器太慢,则可以通过运行另一台RPC服务器来进行扩展。尝试在新控制台中运行另一个rpc_server.go
  • 在客户端,RPC只需要发送和接收一条消息。结果,RPC客户端只需要一个网络往返就可以处理单个RPC请求。

我们的代码仍然非常简单,并且不会尝试解决更复杂(但很重要)的问题,例如:

  • 如果没有服务器在运行,客户端应如何反应?
  • 客户端是否应该为RPC设置某种超时时间?
  • 如果服务器发生故障并引发异常,是否应该将其转发给客户端?
  • 在处理之前防止无效的传入消息(例如检查边界,类型)。