我们发现,在信息过度的时代,信息的筛选、推荐和挖掘变得十分重要,它们决定了我们希望看到什么信息,或者我们能看到什么信息。在选择电影的时候,评分、票房等就会发生影响;在选择一个帖子阅读时,时间、评论数、收藏数、阅读数就会发生影响;事实上,在电子商务领域,越来越多地关注数据挖掘,很多因素都会影响到产品推荐——而这往往意味着直接的收入。
没有更多新发现,只是在一次课堂分享中,我把对其有影响的因素分为这样四个类别,这四类因素不是孤立的,往往相互作用,能够为讨论提供一个更好的框架而已。
时间:“最新发表”、“一个月内”、“过去24小时”等。
关系:陌生人阅读能帮助我们找到意外收获,但更多的时候,我们根据好友、关注的对象来改变用户的信息推荐。信息会越来越多在sns(或:社会性媒体)里面流动。
行为/动作因素:阅读次数、点击次数、收藏次数、评论次数,此外还有比如评分,被购买的次数、票房等等。
相关特征因素:价格排序很常见,这就是一种相关特征。但更常见的是,比如导演、演员,比如作者、书籍类型,比如产品类别、有机与否,这些更多的是内在的,而且可能可以通过分析或多更多相关特征。
它们之间的关系比较让人着迷,比如“时间”、“关系”往往会和“行为/动作因素”发生紧密关联,而“相关特征因素”则能有效地参与数据挖掘,它能帮助我们把“关系”分成更加具体的类别从而优化推荐效果。
在复杂的算法里面,应该是不同因素进行权重赋予,产生推荐结果,然后再根据用户的反馈来机型权重修改。我想这个框架在讨论产品规划时能发挥一点作用。不知道在数据挖掘或者产品规划的现有讨论里是否有类似的参考框架,或者这只是第2次吃到螃蟹,欢迎读者分享告知。 |