🚀 原文地址:

Rasa 默认打开的 API 接口是 http://localhost:5005/webhooks/rest/webhook,我们可以通过 POST 数据到该端口下,从而拿到 Rasa 机器人的回复。例如,你可以 POST 如下一个请求,并拿到机器人的回复。

  1. $ curl -XPOST http://localhost:5005/webhooks/rest/webhook \
  2. -d '{"sender": "user1", "message": "你好"}' \
  3. -H "Content-type: application/json"
  4. # Terminal 中得到的响应
  5. [{"recipient_id":"user1","text":"Hello World!"}]

上述便是 Rasa 默认开启的 Rest 通道,但在实际场景中,我们并不会使用这个 Rest 通道,因为所传进去的不可能是简单的 {"sender": "user1", "message": "你好"} JSON 格式,可能包含更多的键值对,且传进去的数据我们大概率也是需要在程序中进行使用的。

Rasa 支持我们自定义通道,它可以帮助我们实现特定的 API 接口,也就是说我们可以新开启 一个http://localhost:5005/webhooks/bird/webhook API 端口,然后传进去 JSON 数据也可以在通道中进行处理。

当然,Rasa 中提供了多个通道连接器,包括 Facebook Messager、Slack、Telegram、Twilio、Google Hangouts Chat、Microsoft Bot Framework、Cisco Webex Teams、RocketChat、MatterMost,同时你还可以连接你自己的个人网站。目前我并没有使用过这些通道,就不多作介绍了。

在 Rasa 中是通过定义一个 Python 类来实现自定义通道,可以使用 rasa.core.channels.rest.RestInput 类作为模板代码进行修改,能让你快速上手定义自定义通道。

1. name 方法

所实现的类必须继承自 InputChannel 类,且必须包含 name 方法,它的作用是定义连接器 webhook 中的 URL前缀,例如上面的 URL 中的 bird。同时,name 方法也定义了通道的名称,以便你使用任何通道下特殊变种响应。同样地,你应该将通道的名称传给 output_channel 中查询参数来触发意图。

下面我们将自定义一个名为 bird 的通道,具体 name 方法定义如下:

  1. from rasa.core.channels.channel import InputChannel
  2. class BirdInput(InputChannel):
  3. def name() -> Text:
  4. """Name of your custom channel."""
  5. return "bird"

如果你希望使用 bird 通道来实现一个特定的回复,例如在 domain.yml 文件中这样进行使用:

  1. responses:
  2. utter_greet:
  3. - text: Hi! I'm the default greeting.
  4. - text: Hi! I'm the custom channel greeting
  5. channel: myio

这样定义之后,我们自定义通道的 webhook 将会是 http://localhost:5005/webhooks/bird/webhook

2. blueprint 方法

蓝图的方法的使用需要创建一个基于 Sanic 服务器的 blueprint,所实现的 blueprint 至少要包含两种路由:

  • health:对应 / 路由
  • receive:对应 /webhook 路由

先来看一个完整的示例,我们即将所发出的请求是这样的:

  1. curl -XPOST http://localhost:5005/webhooks/bird/webhook \
  2. -H "Content-type: charaset=utf-8" \
  3. -d '
  4. {
  5. "sender_id": "9a05df6b",
  6. "question": "are you a bot?",
  7. "metadata": {
  8. "name": "张三",
  9. "gender": "男",
  10. "age": 16,
  11. "occ": "student",
  12. "school": "北京大学"
  13. },
  14. "sendTime": "202109081625300214",
  15. "answerResult": {}
  16. }'

接下来我们使用 BirdInput 通道(利用 CollectingOutputChannel 类)来接收它,且打印出传进来的内容:

  1. import json
  2. import asyncio
  3. import inspect
  4. import rasa.utils.endpoints
  5. from sanic import Sanic, Blueprint, response
  6. from sanic.request import Request
  7. from sanic.response import HTTPResponse
  8. from typing import Text, Dict, Any, Optional, Callable, Awaitable, NoReturn
  9. from rasa.core.channels.channel import (
  10. InputChannel,
  11. CollectingOutputChannel,
  12. UserMessage,
  13. )
  14. class BirdInput(InputChannel):
  15. @classmethod
  16. def name(cls) -> Text:
  17. """Name of your custom channel."""
  18. return "bird"
  19. def get_metadata(self, request: Request) -> Dict[Text, Any]:
  20. content_type = request.headers.get("content-type")
  21. if content_type == "application/json":
  22. return request.json.setdefault("metadata", {})
  23. else:
  24. return {}
  25. def blueprint(
  26. self,
  27. on_new_message: Callable[[UserMessage], Awaitable[None]]
  28. ) -> Blueprint:
  29. bird_webhook = Blueprint(
  30. "bird_webhook_{}".format(type(self).__name__),
  31. inspect.getmodule(self).__name__,
  32. )
  33. @bird_webhook.route("/", methods=["GET"])
  34. async def health(request: Request) -> HTTPResponse:
  35. return response.json({"status": "ok"})
  36. @bird_webhook.route("/webhook", methods=["POST"])
  37. async def receive(request: Request) -> HTTPResponse:
  38. sender_id = request.json.get("sender")
  39. text = request.json.get("question")
  40. send_time = request.json.get("send_time")
  41. metadata = self.get_metadata(request)
  42. input_channel = self.name()
  43. collector = CollectingOutputChannel()
  44. await on_new_message(
  45. UserMessage(
  46. text=text,
  47. output_channel=collector,
  48. sender_id=sender_id,
  49. input_channel=input_channel,
  50. metadata=metadata,
  51. )
  52. )
  53. output_json = [
  54. {
  55. "senderId": sender_id,
  56. "question": text,
  57. "metadata": metadata,
  58. "sendTime": send_time,
  59. "answerResult": {
  60. "answer": collector.messages[0]["text"],
  61. }
  62. }
  63. ]
  64. return HTTPResponse(json.dumps(output_json, ensure_ascii=False),
  65. content_type="application/json;charset=utf-8")
  66. return bird_webhook

health 部分的实现比较简单,主要是用于测试访问是否正常。

receive 部分的实现中,你需要告诉 Rasa 如何去处理用户所发出的消息,对应到上述代码部分为:

  1. on_new_message(
  2. rasa.core.channels.channel.UserMessage(
  3. text=text,
  4. output_channel=collector,
  5. sender_id=sender_id,
  6. input_channel=input_channel,
  7. metadata=metadata,
  8. )
  9. )

调用 on_new_message 时,将会把用户消息传给 handle_message 方法。output_channel 参数是指实现 OutputChannel 类的输出通道,你也可以使用方法来实现自己输出通道类(例如发送文本和图像的方法),或者当机器人在处理的消息时,你也可以使用 CollectingOutputChannel 收集机器人的响应,并将它们作为返回端点响应中的一部分,这就是 RestInput 通道的实现方式。在实现自定义输出通道时,参考一下其他输出通道的实现方式,例如 rasa.core.channels.slack 中的 SlackBot,将对你非常有帮助。

:::info 💡 值得一提的是,如果使用 response.json(collector.messages) 的话,使用 CURL 得到结果将会是 Unicode 字符,这对于终端调试显然不太友好,所以使用 HTTPResponse(...) 可以中文字符显示出来。 :::

3. 消息中的元数据

如果你需要在自定义操作中使用来自前端的额外信息,可以在消息中通过定义 metadata 键来进行传递。如果适用的话,元数据信息将随着用户消息从 Rasa Server 进入 Action Server,它将存储在 **tracker**。消息中元数据并不会直接影响 NLU 分类或者动作的预测。

💡 注意一下,我们所传递进来的元数据是存储在 tracker 中的,后面我们将会根据元数据信息来进行个性化的回复。

InputChannel 类中 get_metadata 实现方法默认忽略了所有元数据,如果想在自定义连接器中提取元数据,那么需要实现 get_metadata 方法。 SlackInput 类中 get_metadata 方法实现了根据通道的响应格式提取元数据,你可以将其参考作为样例。

4. 自定义通道的凭证

要使用自定义通道的话,你需要在 credentials.yml 配置文件提供对应的凭证,必须包含通道模块路径(非通道的名称)以及必需的配置参数。

例如上面的 BirdInput 的自定义连接器类,我们将其保存在文件 addons/bird_channel.py 中,对应的路径为 addons.bird_channel.BirdInput,对应的凭证如下:

  1. addons.bird_channel.BirdInput:
  2. username: "user_name"
  3. another_parameter: "some value"

为了让 Rasa 知道自定义通道,在启动 Rasa Server 前,我们需要在 credentials.yml 指定路径,并通过命令行参数 --credentials 来加载该文件。

5. 测试自定义连接器的Webhook

为测试自定义连接器,我们可以 POST 消息到对应的 Webhook,相应的 JSON 数据如下:

  1. {
  2. "sender_id": "9a05df6b",
  3. "question": "are you a bot?",
  4. "metadata": {
  5. "name": "张三",
  6. "gender": "男",
  7. "age": 28,
  8. "occ": "student",
  9. "schoOl": "北京大学"
  10. },
  11. "sendTime": "202109081625300214",
  12. "answerResult": {}
  13. }

完成上述所有操作之后,我们来运行 Rasa Server:

  1. rasa run -p 5005 --enable-api \
  2. --endpoints ./endpoints.yml \
  3. --credentials ./credentials.yml \
  4. -m models/

我们通过如下请求来获取机器人的回复:

  1. $ curl -XPOST http://localhost:5005/webhooks/bird/webhook \
  2. -H "Content-type: application/json" \
  3. -d '{
  4. "sender_id": "9a05df6b",
  5. "question": "are you a bot?",
  6. "metadata": {
  7. "name": "张三",
  8. "gender": "男",
  9. "age": 16,
  10. "occ": "student",
  11. "school": "北京大学"
  12. },
  13. "sendTime": "202109081625300214",
  14. "answerResult": {}
  15. }'
  16. # 得到的结果
  17. [{"senderId": null, "question": "are you a bot?", "metadata": {"name": "张三", "gender": "男", "age": 16, "occ": "student", "school": "北京大学"}, "sendTime": null, "answerResult": {"answer": "I am a bot, powered by Rasa."}}]