您的当前位置:首页正文

推荐系统常用算法概述及简单对比

2022-07-20 来源:意榕旅游网
316论述

2018年5月推荐系统常用算法概述及简单对比李张安(北京师范大学第三附属中学)

最后是对混合式推荐的分析。常【摘要】本文首先就推荐系统背景进行介绍,再对推荐方法进行描述,然后将传统的两种推荐方式进行对比,

或者混合推荐。其中协同过滤原理在于,通过用户历史评价,预测用用的推荐算法有:协同过滤推荐、基于内容的推荐,目前主流也基于这两种,

户偏好,与周围的关联;基于内容的推荐是通过具体内容预测用户偏好。

混合推荐【关键词】协同过滤;基于内容的过滤;

【中图分类号】【文献标识码】【文章编号】(2018)TP319A1006-422205-0316-02

推荐系统袁可以推荐满足用户个性化需求的信息袁相比探索引擎袁它不需要用户显式地提出需求袁可以自动的分析用户历史袁建立模型袁为用户进行推荐遥传统的搜索算法给每个用户呈现的结果是基本相似的袁无法根据用户的个人喜好提供个性化的对应服务遥信息过多袁会使对用户更难找到满足自身需求的信息袁这种现象学术上称为信息过载遥当今能够解决信息超载的方法基本有两种袁即个性化搜索和个性化推荐遥

推荐需要预测需求袁它可以揣度用户的需求袁不需用户提出遥它相比于个性化搜索袁具有更加智能化袁自主化袁自动化等诸多优点袁是解决当今问题的一种颇为实用的手段遥

1引言2.1基于用户的协同过滤

荐袁其出发点是人的兴趣不会只存在于个体袁在个体之外有多个个体可能有兴趣袁因此可根据兴趣相近的用户对信息做出的评价进行推荐遥根据目标用户的历史属性找邻居袁分析邻居的评分来预测目标对未接触过的物品的喜好袁然后把邻居喜欢的项目推荐遥

协同过滤没有特定特征要求袁对象特征不需要文本化袁具象化的文本描述袁能处理音乐尧电影等相对主观袁情感化的信息遥

2协同过滤协同过滤推荐可分为院基于用户尧基于物品的协同过滤推

在协同过滤方法中袁系统可直接对新物品评分遥其中基于用户方法袁可对用户的喜好进行整合袁以此寻找兴趣相近的用户遥主要步骤为院

渊1冤收集用户信息遥

渊2冤整合可以体现用户兴趣的信息遥一般评价分为两种袁

或非线性电感的就叫做非线性动态电路遥

范德坡方程院

在动态电路中袁范德坡振荡是非保守的尧非线性阻尼振荡遥它的二阶微分方程院

dx-滋渊1-x2冤dx+x=0渊5冤2dtdtx是位置坐标且是关于时间t的函数曰滋是一个标量参数袁表示非线性和阻尼强度遥

可以将范德坡振荡写成其二维形式院duc=-1i渊6冤d子着L

3diL=着[uc-渊1iL-iL冤]渊7冤d子32

统袁运用理论分析与数值模拟的研究方法袁结合图像分析了典

型非线性系统的特性遥通过数值模拟发现院非线性系统具有典型的混沌效应袁方程的解表现出了对初始条件极强的敏感性袁而且相图围绕一个运动的平衡点逐渐展开[6]遥

本文讨论的问题比较简单袁列举实例较少袁不具有说服力遥后期工作考虑将阻尼振动系统中加入不同形式的驱动力袁观察系统振幅袁能量等随时间的演化关系曰讨论多种非线性混沌电路袁然后对比分析袁得出一般性规律遥同时对于电路系统袁最好的研究方法是理论与实验相结合袁多利用仿真手段模拟系统的一些特性遥

[1]艾尼瓦尔窑肉孜袁阿布力米提窑阿布都热衣木袁买吾蓝窑买买提.非线性系统中一些物理特征的数值模拟[J].南开大学学报渊自然科学版冤袁2009袁42渊4冤院51~56.

[2]张锐波.基于受迫振动实验中几个问题的理论推导[J].大学物理实验袁2014袁27渊4冤院57~65.

[3]杜全忠袁王鹏袁王旭明袁姚明.受迫振动的阻尼特性研究[J].实验室研究与探索袁2015袁34渊11冤院14~17.

[4]黄安山.非线性电路中的混沌现象[J].大学物理袁2004袁27渊4冤院39~40.[5]熊伟.非线性电路的混沌现象[J].湖北第二师范学院学报袁2009袁26渊8冤院79~80.

[6]彭森第袁叶华文袁陈龙袁彭伏波.含有高阶非线性项的范德坡方程的镇定[J].企业技术开发袁2010袁29渊15冤院43~44.

4展望参考文献

电流-电压图像图4ε分取0.2和0.002时,

图4画出了电压要要要电流图像袁从图中可以看到院着的取值

越小袁图像环形间距越均匀曰着的取值越大袁外围图像的间距越小袁彼此更为靠近[5]遥当滋渊贼冤是正有界函数时袁系统存在周期解曰当滋渊贼冤趋于一个正常数时袁系统存在唯一的全局稳定的周期解遥

3结论收稿日期:2018-4-23

本文通过研究阻尼振动与混沌电路等典型的非线性系

2018年5月主动评价以及被动评价袁主动评价是直接基于用户对一项物品使用的评分和评语等分值性数据袁而被动评价则是系统在用户使用物品过程中袁甚至是过程外袁对用户行为模式进行时时调查渊3袁冤得最出近的邻相搜索

应评价遥

基于用户的协同过滤的目的是寻找一个或几个与目标用户行为喜好相近的邻居袁将两个用户的相似度进行计算遥评价指标有院Pearson相关系数袁余弦相似度袁修正余弦相似度袁变异系数等渊4冤生成遥

结果

通过上一步产生的近邻袁可以预测用户的打分遥推荐形式包括Bestitem尧Top-N遥其中袁前者针对的是个体袁对不同对象袁产生的2.2结果有差异曰后者则是选基基于于用物户品的的协协同过同滤过依滤

出前N个推荐遥

赖用户信息袁过少会造成推荐困难袁即冷启动问题曰过多增加计算量遥于是可从用户对象转向物品要要要基于物品遥基于物品的协同过滤认为袁用户喜好物品袁会给高分遥计算物品间的相似性袁使用物品属性袁来联系用户和物品袁其中属性代表在系统中用户和物品的潜在特征袁步骤为院

渊渊12冤冤收针集对用项户目信的息最遥

近邻搜索

首先对待测定物品和高评分物品得出物品相似度袁然后以此作为权重袁参与到评价物品的各项分数上袁然后预测未打分的物渊3品冤生成的得结果

分遥

不考虑用户间的差别袁更注重物品的相似度袁因而它精确度较差遥它不需要用户处对物品尧信息评价之外的其他内容袁也比较用户偏好区别袁计算量减少遥而且基于评价袁不需要分析行为等复杂3基于内容的过的程推袁干扰荐量较少袁相对更加稳定遥

基于内容推荐袁根据用户已用的物品内容来确定物品的共性袁使用特征属性定义商品对象袁根据其历史记录提取特征袁预测偏好遥然后通过用户为物品的评价袁推荐相似度较大的物品遥

它可以应用于稀疏状况下的商品遥该算法优点是计算简单高效袁对评分数据的依赖性小袁且能推荐新尧跨度大的物品曰缺点是难以区分和拓展兴趣资源袁推荐结果缺乏新颖袁不能推荐其他渊1类冤收别集的信用户息信遥息

主要步骤为院

提渊2取冤相似用户度的计兴算

趣物品类别及属性并分类遥确定与用户兴趣物品相近的物品信息袁计算相似度明确用户兴渊3趣冤生成袁考察推待荐测结果

物品或信息对目标的相似度遥

4混把类合别式按照推相似荐综度述进行降序排序袁确定最优解并推荐遥单独使用协同过滤推荐袁相比于单独使用的基于内容推荐袁二者在特定方面存在这各自的不足袁只能适用于较为单纯袁数据特征相对鲜明的信息环境遥其次袁某些特殊的问题袁传统推荐方式已经无法很好地进行解决遥综述他人的混合式推荐袁主渊要1冤叶如下在协院

同过滤系统项目冷启动的混合推荐算法曳中袁作者基于内容预测袁让用户评价矩阵代表用户偏好袁对用户筛选袁基于内容进行预测袁精确度预测值达到阈值才接受袁然后对用户相似度进行度量袁再产生新的推荐遥

论述317

渊2冤在叶一种融合协同过滤和内容过滤的混合推荐方法曳中袁先调整Pearson系数袁将物品热度把变量改为不同条件下赋值的参数袁削减了同时关注热门导致的不公平遥然后将相似用户划分A尧B尧C三类遥其中A代表比较符合袁B代表部分兴趣与目标渊3冤在用叶户基相于符情袁感C的指混兴合趣推与荐目标模型用曳户整一文体上基中袁作者本在一致协同过遥

滤的基础上加入主观情感的权重遥将用户当前和历史记录预处理袁基于物品方法计算物品相似度遥基于内容对物品进行过滤遥接着计算用户的情感值和类别遥根据用户的兴趣特征构建行为矩阵袁结合用户的评分数据袁利用协同过滤方法进行计算结果袁与混合推荐算法推荐结果进行相似度计算袁推荐结果遥

该算法可保证准确率袁提高召回率袁同时缓解决冷启动问题5遥混合推荐相比单一推荐算法袁推荐精度更好尧模5.1评型更稳定遥

精精确价指标确率是率与预召回测正确率

的正样本与分类正样本的比率袁召回率是分类正确的正样本与所有正样本的个数之比遥设分类器分类正确的正样本集合为A袁Precision渊A袁B冤=A疑B正样本集合为B袁则有院

渊1冤

5.2Recall渊A袁B冤

A疑ABB渊2冤

覆盖覆盖率率

指的是分类器分类出的样本占总样本的比例袁它可以反映模型的泛化能力袁与准确率相博弈袁共同反映模型预测5.3的性能遥

准确准确率率

指的是系统给出正确预测的分类个数袁占所有预

测结果为正的总体的比例遥计算算法的准确率时袁设y^

个样本的预测类别袁y个测试样本i是第ii是其真实类别袁则在n上的准确率为院

accuracy=1n

n^6总基于结移i=1

1蓸yi

=yi

蔀渊3冤

内容的推荐中袁评价物品是根据物品特征的自身属性曰而基于物品的协同过滤袁是根据用户对物品的打分和评价遥基于混合式推荐在不同情况下性能优劣的对比袁证明混合式推荐也需要在不同的情况下做出两种传统方式配比权重的调整遥这要求设计者对推荐环境及背景做深刻的了解和分析袁甚至进行算法的创新或调整袁从而确定最适合于具体问题的方法遥

[1]参考文献

[2]浅说机器学习[3]分类念机器算法学习概模述中野迭代法冶.型与评比价较渊.

EvaluatingMachineLearningModels冤-主要概[4]与[5]均方误差陷阱.

渊MSE冤和均方根误差渊渊陈凯袁朱钰.机器学习及其相关算法RMSE综述冤和[J].平统均计绝与对信误差息论渊坛MAE袁2007冤.袁22[6]5冤院学理论李105~112.

建袁萍2011袁王渊立16国冤院.机240~242.

器学习理论在教育教学测评中的有效性分析[J].收稿日期:2018-4-16

因篇幅问题不能全部显示,请点此查看更多更全内容