基于可疑用户度量的鲁棒推荐方法研究_伊华伟著_9787551727266

本书基于可疑用户度量的思想，从基于内存和基于模型的推荐技术两方面展开研究，致力于设计一系列鲁棒性高、精度损失少的协同过滤推荐算法。

第pan>章绪论

1.pan style="font-family:宋体">研究背景和意义

随着互联网技术突飞的发展，人们喜欢在互联网上通过电子商务网站来购买各种各样的商品。然而，随着网上交易用户的日益增多和商品信息量的极大丰富，出现了严重的信息超载（Information Overload）现象[1-3]。所以，人们在享受电子商务带来便利的同时，也面临着一个严峻的挑战——如何在信息的海洋中、快捷地找到自己真正所需的商品信息。因系统（Recommender Systems)[4-7]应运而生，它与电子商务系行结合，能够有效地解决信息超载问题。与传统的搜索引擎不系统能根据用户的个人资料、商品购买记录以及对商品的评价等历史信息来分析用户的个人兴趣、爱好，快速找出并主动为其可能感兴趣的商品信息，从而在实现个的同时提高用户检索信息的效率。

1997年，Resnick和Varian[8]:“”目前，电子商务网站是个系统的一个主要应用领域，比如Amazon、豆瓣网、eBay和网等都不同程度地使用了多种形技术[9]，主要有基于内[10-3]、协同[14]、基于知[15-16]和[17-18]等。其中协同（CollaborativeFiltering Recommendation)技术是早出现、理论为成熟和应用为广泛的技术之一[19-20]。本书内容即基于协同展开系列相关研究工作之成算法决定了系统的性能好坏，系统的核心部分[21-2]。协同算法分为基于内算法（Memory-based RecommendationAlgorithm）和基于模算法（Model-based Recommendation Algorithm）两大类，其中基于内算法又可分为基于用算法（User-basedRecommendation Algorithm)[23-24]和基于项目的] 行 đ __m-based Recom.mendaion Algorithm)[25-26]。协同算法首先计算系统中用户（项目）间的相似度，然后依据相似度找出与目标用户（项目）相似的邻居集合，

后根邻用户对目标项目的评分（目标用户邻项目的评分）为目标用户。虽然基于内算法易于实精度高，但相似度计算和寻邻的过程中需要遍历整个评分矩阵，所以算法运行效率会随着评分效据的增多而降低，实时性不高。基于模算法首先运用统计或机器学习等方法对用户-项目评分数行训练得到一个模型，此过程通常离线完成；然后利用该模型在线为目标用户。相比基于内算法来说，基于模算法实时性较高。常见的基于模算法有贝叶斯模型[27]聚类模型[28-29]、回归模型[30]、基于Markov链的模型[31]、潜在语义分析模型[32-34]和目前应用广泛的基于矩阵分解的潜在因子模型[35]等。协同算法基于用户对项目的评分数据来完成对目标用，

因此，收集到的评分数据越多，越能彰显用户的喜好，越能得到高质结果，这就系统必须具有较强的开放性，以充分调动用户参与评分的积极性[36]。然而，一些恶意用户从个人利益角度出发，系统的开放性，人为地将大量虚假用户评分注入到系统中，企图影响用户的购买行为。由此可见，虽然系统可用的评分数据增加了，但是数据质量却严重降低，使系结果受到很大影响。这种将虚假用户概貌注系统中干扰系统的过程，使系结果产生偏差的行为被称为托攻击（ShillingAttacks),也叫概貌注入攻击(Profile Infection Attacks)攻击(Recom-mendation Attacks)[37-38][39]：随机攻击（Random Attack)、均值攻击（Average Attack)、流行攻击（BandwagonAttack)和AoP攻击（Average over Popular Items Attack)等。根据攻击的目的一步将托攻击分为推攻击（Push Attack）和核攻击（Nuke Attack）两类，分别用来提高和降低目标项目被的频率。

……

你还可能感兴趣

我要评论