近日,重庆研究院大数据挖掘及应用中心团队在建立长期有效的推荐系统研究方面取得进展,研究人员率先提出了推荐系统个性化的概念,并对推荐系统的个性化和建立长期有效的推荐系统进行了系统地研究。
由于信息技术的不断发展和互联网经济的日益繁荣,使得人们被迫生活在一个信息爆炸的大数据时代,人们每天都要被迫面对大量各种各样的信息,从而造成了严重的信息过载问题。如何从海量看似无关的数据中快速有效地筛选和找到用户感兴趣的信息,是迫切需要解决的问题。目前解决信息过载问题主要有两个技术:搜索引擎和推荐系统。搜索引擎往往被动地返回与用户给定查询关键字相匹配的内容,而推荐系统可以主动预测用户可能感兴趣的信息。事实上,目前搜索引擎也在不断植入推荐技术,因此从长远角度来看,推荐系统将是解决信息过载问题的最有效手段。然而,现有的推荐系统往往使用单一的推荐算法,即使采用多种算法进行混合,因为各个参数在使用时对所有用户也是固定不变的,因此仍然可以视为一个单一的推荐算法。虽然单一的推荐算法可以在一定程度上提升推荐系统的性能,但是这些方法往往忽略了用户兴趣爱好随时间变化、选择行为的差异性以及使用推荐系统的长期效应(如对系统健康性的影响)等这些因素。
针对这些新的问题,该研究团队首先提出了一种算法参数个性化的推荐算法,通过为不同的用户设置不同的参数来混合两个不同的推荐算法。相比固定参数和单一推荐算法,该方法可以获得更好的推荐效果。其次,该研究团队认为理想的推荐系统,应该是每个用户都采用最适合他们自己的推荐算法,即推荐算法的个性化,在该方面的研究中,研究团队提出了实现推荐算法个性化的两类方法:其一是把选择权交给用户,系统提供某种机制让用户实现算法的自主选择,其二是系统通过深入挖掘每个人的行为模式,自动发现用户最佳的推荐算法,并提供一种机制让用户确认。最后,为了评测使用推荐系统的长期效应,该研究团队提出了一种推荐网络演化模型,并在演化网络上,对推荐算法个性化的推荐系统的长期效应进行了分析。实验结果表明,对于采用单一推荐算法的推荐系统,采用推荐算法个性化的推荐系统在显著提高推荐精度的同时,可以在推荐精度和系统的健康性方面起到很好的均衡作用。
由于推荐系统被认为是在大数据时代解决信息过载问题最有希望的技术,该研究在解决推荐系统的长期有效性问题方面取得了一定的突破,在推荐系统个性化发展方面提供了一定的理论基础和技术保障,对设计下一代高效率的推荐系统具有很好的指导作用。
上述研究内容获得国家自然科学基金项目和重庆市基础科学与前沿研究技术重点专项支持。