每周一辩 | 如何做好推荐系统?
每周五晚十点,期待一场互联网思想交锋
辩主: 李启超
微信产品offer**
推荐系统 辩主观点
想想还是挺可怕的,你看的新闻是网易新闻、今日头条推荐给你的,买的网购是淘宝推荐给你的(排序本身就是一种推荐),吃的店是大众点评推荐给你,你自以为是自主的选择其实全是在机器算法之下。
其实推荐本身是一件好事,我无需这么恐惧。信息爆炸到现在,要是没有推荐系统的帮助,会浪费多少时间。
今天有时间就来数数这些日子做推荐系统踩过的坑,不求以后不再踩,但愿少踩。
你得明白做推荐最根本的原因
**
“推荐系统是解决互联网海量信息资源出现信息过载问题的方法”
这句话在几乎所有的推荐系统文章,书籍或者巴拉巴拉专栏都会说,仿佛做了个推荐系统就能解决信息过载一样,你咋这么能呢!在做推荐系统之前先问问自己,到底你能不能做一个解决问题的推荐系统 ,推荐系统本身就是基于海量的数据来进行的筛选行为,淘宝做推荐系统无可厚非,它存在的价值远远大于它可能带来的负面效果。推荐要是效果不好(或者产品设计的方案不好)系统本身就是噪声信息的来源。用户唯恐不及,还解决什么“信息过载”。
我虽然很苦恼在淘宝上每次买好商品后它都会推荐给我一个更便宜的!但我也不得不承认它在我决策之前的排序很方便的解决了我的筛选思考成本。
所以我跟工作室里面去淘宝做推荐算法的二狗子说让他帮我提这个需求,不知道现在怎么样了。一直都觉得推荐给你已浏览/购买过的信息是一件很蠢的行为。尤其是当它更便宜的时候!!!
任何一种方法论系统的存在都是为了解决问题、提高效率,在决定做推荐之前,先问问自己到底要解决什么问题,能提高什么方面的效率,值不值得用推荐。有点很奇怪的是这些日子的实习下来,发现我们都是很会自圆其说的生物,或者说是人本身的自私基因的导向集合总会偏好有利于自己的方向,总是会抗拒来说服自己的人。不知觉的就会跟自己说:“嗯,这很值得用推荐!”
自我学习的迭代数据选择
永远没有一劳永逸的解决方案。
——尼古拉斯.手抓饼
一个小数据集合,一个产品场景,一个评测指标,一个推荐算法,可以有多少种具体实现方案呢?之前看到一个博客上说起码有十几种。在具体场景与业务逻辑上,这样的变换会有多少?有牛人坐镇有大量开放资料是奢侈而宝贵的,但经验毕竟不可照办,资料只能参照,根据当下的产品场景具体分析,并且必须要不停的尝试。
不停的尝试就需要不停的对推荐算法进行迭代,怎么迭代?数据,你得明白哪些数据在哪些场景下是有效的,根据数据结果来不断的修改推荐系统,不求最好,但求能在合适的场景下推荐给合适的用户合适的信息。
推荐系统就好像ktv的”妈妈”一样,你进到一家ktv,她会先看你的着装打扮和消费水平,确定你能消费的起什么水平的公主,再去后台筛选出这些公主,把其中感冒的,身体不舒服的去掉,经过一番包装呈现给你。这本身就是一个根据用户场景来判断的筛选推荐机制。那“妈妈”在这过程中用到了哪些数据呢? 你的着装打扮和消费水平。这些基本的场景数据经过她的大脑的选择配备出基本的消费水平,再去后台以这个为基准按照水平从低往高选出公主,既保证了你可以消费的起最基本的也可以让你消费更高层次的公主。而这位“妈妈”的数据筛选来源于她长久的生活经验。她明白哪些数据是重要的。
一个好的推荐系统必定也是在不断自我学习的,你作为规则的制定者,你得明白哪些数据是推荐系统在自我学习的过程必需的,并且定下权重。同时因为用户的行为是多变的,肯定会有意外的情况的发生,所以其实你在推荐系统不断学习的过程中要确保出现这种意外情况发生的时候也能推荐出合理的信息。
一个农民打扮的千万富翁来到你的ktv你总不能推荐给她四五十岁的欧巴桑吧。所以你的推荐系统应该是既包含了最基本的欧巴桑但是又包含了更年轻的公主,没有人会抗拒更年轻的公主出现在自己的眼前,选不选是他的事。你要做的是把握这个度,如何避免不必要的信息造成给用户不必要的干扰呢?
难!
要是你不明白哪些数据其实是很重要的。可以试着搭建数据监控,重视数据分析,创造让效果“成长”的土壤,好的算法不是仅仅是设计出来的,好的方法是依托于迭代环境,不停尝试出来的。
高估推荐系统的需求捕捉能力
搜索跟推荐是相亲相爱的两兄弟,搜索是显性满足用户需求,推荐是隐形满足用户需求,我一直觉得做搜索的产品经理是一件很幸福的事,从来没有一个用户会把他的需求如此明确的告诉你,你所做的就是尽可能高的信息匹配而已。当然这也是最难的地方。
推荐系统则需要你能够良好的感知用户未明确陈述的需求,为其呈现信息。这里面就存在着一个问题,既然用户连自己想要什么都不知道,你凭什么就说你推荐的就是用户想要的,那这样还要搜索引擎干嘛,直接打开推荐系统就是了。
做推荐系统的产品经理总会高估推荐系统的需求捕捉能力,我们总会认为我们已经抓住了用户需求变化的规律,但实际上其实也只是一厢情愿。
我们是无法明白用户在点击行为背后的状态是怎么样的,也无法预测他接下来的行为是怎么样的,我们现在尝试的办法就是通过各种各样的第三方因素来辅助判断,提供其中最有可能的几种结果,让用户自己来选择想要的。(迷之自信之用户想要的就在我们的推荐选项里面)然后可以再通过a用户的可能性行为协同推荐有着相似行为的b用户,巴拉巴拉一大推自我学习的行为来完善系统。
选自某个博客的一句话:
推荐系统有其边界,一切技术均有其边界,局限于当前技术成熟度,局限于数据,局限于现实世界与技术世界的距离。当产品经理不了解技术的边界,而技术人员则缺乏产品思维的时候,这种错误便容易发生。
推荐几种现在视频方向常用的推荐算法,去了解一下他们背后的原理
1.personalized video ranker
2.top-n video ranker
3.trending now
4.continue watching
5.video -video smilarity
6.page generation:row selection and ranking
为什么不直接放链接呢?相信我,复制—黏贴,google搜索,比我直接放链接来的更好。干嘛要把眼界局限于我说的呢。
插播一句
10.5日15:00
辩主在校园说网站开设了
产品主题的 1对4 的 VIPTalking
想要报名参加的扫描下方二维码预定吧
(或者电脑搜索“校园说”进网站去找他)
单约撕还是比较舒爽的
每周五晚十点,期待一场互联网思想的交锋
提出你的观点至campussay@163.com
成为辩主,“耐撕”如你
你也可以在下面写留言怼辩主☟ 阅读原文 在看