值,对尚未处理的情报进行自动评价(预测),将得分高的情报主动向用户推荐。自动评价的预测值则是根据其他用户和本用户的评价情报,采用皮尔森相关系数等相关算法而计算出来的。
这种方法有它的缺点。由于归根到底是靠用户的评价值而进行推荐的,如果某个情报谁也没进行评价则永远得不到推荐。另一方面,评价数据不足时推荐的精度也受影响。另外,情报量和用户数(评价数)差距较大时,难以找到附近的用户等。
mit(麻省理工学院)的音乐情报推荐系统ringo,明尼苏达大学的netnews推荐系统group lens等许多协调过滤系统都采用了这一种方法。
iii. feature guided automated collaborative filtering(fgacf)
根据用户的爱好,从事的领域各不相同这一现实,采用把作为过滤对象的项目群赋予属性情报,从而缩小问题的范围,提高推荐精度的方法即为fgacf法。firefly networks 公司(现已被microsoft公司收购)的firefly采用了这个方法。
纯粹的acf基本上不考虑情报的内容,在情报量不断增大的时候仍把各种情报一视同仁,很容易造成错误的推荐。另外,存在着随情报量增大计算时间也增加的问题。为解决这些问题,事先把各种情报通过赋予属性情报的方法进行分类(feature guided),根据属性情报分组,将爱好相近,领域类同的有用情报尽早地向用户推荐。
iv. content-based collaborative filtering
当主要以web网页,netnews信息等文章情报作为过滤处理对象的时候,同时结合情报内容(contents)过滤处理和协调过滤处理两者长处的作法也逐步得到了完善和发展。
近年来,以互联网的各种web网页作为过滤处理对象,从文章中出现的各个关键词组出发,对系统中新登录情报进行预测评价的方法受到了广泛的关注。通过事先将各种情报分组的方法,达到提高协调过滤处理精度目的的手法得到了引人注目的发展。
斯坦福大学(stanford university
上面提到的作为netnews的推荐系统grouplens也在把成为推荐对象的文章分成newsgroup方面下了大的力量,所以从广义上也可以说是一个fgacf系统。
除此之外,世界上各大学和公司也在研究利用情报的属性进行多变量解析的cluster分析法自动地把项目分组,从而提高系统性能和精度。
以上各种算法的实现,基于大量的传统数学模型,一种算法中可能包含有多种数学模型,也可能是某一算法对应于多种数学模型候补。从类别上可分成类似算法数学模型,分组算法数学模型,自然语言分析数学模型等三类。
关于这些数学模型情报,我们在下一节中有较详细的记述。
协调过滤法的特点
下表列出了协调过滤法的主要特点。
优点 缺点
不依赖于情报的内容
可解决仅靠一般方法而解决不了的情报过滤问题 初期评价的问题(early rater proble
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>