白癜风那家医院治疗好 https://wapyyk.39.net/bj/zhuanke/89ac7.html 作者|刑无刀 编辑|Monica
上周,极客Live邀请到了链家网资深算法专家刑无刀、MacTalk池建强来做分享,主题为:“如何入门并成为一名出色的算法工程师?”
他们从7大块方向进行了谈论与扩展:
现推荐系统存在哪些误区?
我是怎样和算法结缘并深耕8年?
推荐算法相关学习方法及资料推荐
优秀算法工程师的成长路径是怎样的?
企业喜欢招聘怎样的算法工程师?
介绍及对比推荐算法领域常用的工具及模型
实施推荐系统时遇到的几大问题
现将视频整理成文字,分享给大家。
1推荐系统存在哪些误区?池建强:麻烦无刀老师给大家解读下,推荐系统最主要的是按用户的点击率去做的推荐算法吗?
刑无刀:这个肯定不是用历史点击率来去排序的,不然新的东西不能得到点击、暴光的机会。不过,最终还是会形成马太效应,就是不管你怎么设置个性化,怎么做算法,你会发现趋势跟热门的趋势会一致的。
一般会在热门趋势的基础上做个性化推荐。实际上,这种买啥推啥的推荐,在业界是有共识的,这样做,确实效果好。
池建强:有时候,系统需要经过很多次测试,才能知道这个用户是否对这个东西感兴趣,但现实中没有这么多机会的,你给用户推荐了两次他不感兴趣的东西,他可能就撤了。那,这种情况下,你怎么去做推荐?
刑无刀:这种情况确实难。如何真正搞清楚用户讨厌什么,喜欢什么,以前我们可能会有些辅助,比如跟产品打配合,他们会做用户调研,或者说通过一些活跃度比较高的用户,去找到这些感兴趣和不感兴趣的点。
但说实话,这算是特征工程的范畴:找到一些有效的特征,哪怕做各种很多人肉的工作。
刑无刀:刚才有人问,国外的推荐系统和亚马逊的推荐系统有什么区别及差距?
我觉得最重要的差别是思维模式上的区别,在做任何策略,或者是做一些尝试的时候,他们首先会想到这个东西怎么去量化,这个效果要定什么指标去评价它。量化,这个很重要。他们基本上会把所有东西都量化下来,然后才开始去思考这件事情怎么做。更多开源的东西,大多数人都可以获取得到,差距并不是特别大,但实际上为什么最后的效果千差万别?
其实,就是大家拿到一样的锤子,如何去用这个锤子?有的人是用砸,有的人是用推等等。就拿锤子这个例子,再说的深入一点。
首先你得看看,你要面对什么样的钉子,你面对什么样的问题。你得定义钉子砸进去的深度,其次是定义钉子的颗数,这是首先要考虑的事情。我现在链家也是,告诉身边的同事,首先要想清楚怎么定义它,怎么量化它。因为你不量化它,你就没办法优化;没办法优化它,你就没办法控制它。有人跟我说,我今天尝试了这个算法,效果很好,我就问他,你这个效果好,到底是指什么?是指准确率好,还是指IUC,还是指什么?
所以,最基本也是最重要的,你得有个量化的标准。这一点,是我觉得国内外做推荐系统最大的区别。
池建强:评分数据做推荐,为什么大家对评分数据这么