在迪拜,有大约8,000家餐厅,世界上最高的建筑,50多个商场,许多海滩,主题公园等等。目的地数量巨大 - 那你下一步去哪儿?
你并不是唯一一个试图回答这个问题的人。
Careem一直在努力弄清楚用户下一步会走向何方。不仅在迪拜,而且在我们所在的所有15个国家以及该平台的所有3300万用户中。
为什么乘车服务需要答案?
想象一下,我们不是要求用户通过手动输入地址在地图上搜索目的地,而是简单地给他们一个最可能的位置列表供选择。
一键式预订可以让客户更快更轻松地了解客户,并且知道客户希望接下来的位置 - 甚至在他们告诉我们之前 - 使我们能够通过确保更繁忙的区域提供更多的运输选项来改善我们的服务。
Careem数据科学团队提出这样一个问题:“如果我们建立一个有监督的机器学习 模型来解决这个问题,那么预测用户去向何方需要哪些最重要和最丰富的功能?”
例如,如果历史旅行支持,“早上回家工作”听起来像是一个合理的猜测。或者,例如,“周末 - 家庭购物中心”,如果该人喜欢购物。在使用数据进行验证后,最相关的功能更清晰,即位置,时间和用户在一天中特定时间与位置的交互。
在这里,CatBoost发挥其超级强大的处理分类功能。CatBoost是一种先进的机器学习算法,允许用户通过排序任务,预测和提出建议,快速处理大型数据集的分类功能。
一周中的某一天和一天中的一小时都是明确的特征。每个位置或一小部分位置也是分类特征。一个城市包含数千个这样的位置。如果你必须手动编码它们就会成为一个巨大的问题 - 它也会大大增加数据集的大小,减慢训练速度并且仍会产生非常差的结果。
这就是Y andex开源CatBoost之前的情况。它不仅独立地考虑了分类特征,还利用了分类特征组合,这正是我们处理“早晨 - 家庭工作”等模式所需要的。
使用这个,我们现在有了算法 - 可以非常精确地预测下一个用户移动的算法。Careem在其网络中拥有150多个城市,数百万次旅行,并且一直在发出大量请求。这是在任何给定时间要处理的大量数据。
人们普遍认为300毫秒对于机器学习系统来说是一个非常好的响应时间,但在Careem的情况下,这只是不够好并且会导致客户体验太慢。在Careem,我们需要做得更好……所以我们做到了。
CatBoost与Careem应用程序和AI相结合的性能超出了所有期望,为我们的客户提供了一位数的响应时间。
该模型(称为目标预测服务)目前正在Careem应用程序中为用户提供服务,并确保我们的系统是最佳的。
所以下次你在你的Careem应用程序上点击“Yalla!”时,请记住它不仅仅是发送电子邮件,你实际上刚刚开始涉及一些严重的人工智能的过程,以及一些最快的响应时间。机器学习系统。
当您在我们的应用程序上预订时,从第二个按下按钮到您的乘车到达时,将发生近500个动作。
Careem的人工智能平台 - 称为Yoda—拥有最先进的机器学习周期。它甚至能够以令人难以置信的准确度预测某个地方在两周内的需求以及需要驾驶员的地方。这有助于我们确保等待时间尽可能低,我们的司机可以获得更多票价。
如果您使用Careem服务六个月,AI将更加适应您的需求,因为它不断学习如何为 您 提供更好的服务。
你下次去哪儿?是的,我们这么认为。