13. 快速搭建第一个系统并开始迭代

你想要构建一个新的反垃圾邮件系统,你的团队有几个想法:

  • 收集一个大的垃圾邮件训练集,例如,设置诱饵系统(Honeypot):故意将一个假的电子邮件地址分发给已知的垃圾邮件发送方,以便自动收集他们发送的垃圾邮件;
  • 开发用于识别电子邮件文本内容的功能;
  • 开发用于识别电子邮件标题特征的功能,以分析出邮件消息都经过了哪些服务器;
  • 等等……

即使我在反垃圾邮件系统上有着丰富的经验,也很难选择其中的一个方向。如果你不是该领域专家的话,那会更难。

所以,不要试图去设计和构建一个完美的系统。相反,应该快速地构建和训练出一个初始系统来——这或许只需要几天时间 [1],即使这个基础系统和你要建立的最佳系统隔个十万八千里。但对这个基础系统进行研究仍然是值得的:你将快速找到一些线索来帮助你指出你该投入时间的最有希望的方向。接下来的几个章节将指导你如何理解这些线索。

13. 快速搭建第一个系统并开始迭代 - 图1

[1].这个建议是针对那些想要构建人工智能应用程序的读者,而不是那些想要发表学术论文的人。稍后我会回到做研究的话题上来。