大数据处理平台的应用课件.ppt
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据处理平台的应用课件.ppt》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据处理 平台 应用 课件
- 资源描述:
-
1、第十章: 大数据处理平台的应用10.1 推荐系统概述 10.1.1 什么是推荐系统 10.1.2 长尾理论 10.1.3 推荐方法 10.1.4 推荐系统模型 10.1.5 推荐系统的应用 互联网的飞速发展使我们进入了信息过载的时代,搜索引擎可以帮助我们查找内容,但只能解决明确的需求 为了让用户从海量信息中高效地获得自己所需的信息,推荐系统应运而生。推荐系统是大数据在互联网领域的典型应用,它可以通过分析用户的历史记录来了解用户的喜好,从而主动为用户推荐其感兴趣的信息,满足用户的个性化推荐需求 推荐系统是自动联系用户和物品的一种工具,和搜索引擎相比,推荐系统通过研究用户的兴趣偏好,进行个性化计算
2、。推荐系统可发现用户的兴趣点,帮助用户从海量信息中去发掘自己潜在的需求10.1.1 什么是推荐系统 推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售 “长尾”概念于2004年提出,用来描述以亚马逊为代表的电子商务网站的商业和经济模式 电子商务网站销售种类繁多,虽然绝大多数商品都不热门,但这些不热门的商品总数量极其庞大,所累计的总销售额将是一个可观的数字,也许会超过热门商品所带来的销售额 因此,可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额。这需要通过个性化推荐来实现10.1.2 长尾理论 热门推荐是常用的推荐方式,广泛应用于各类网站中,如热门排行榜。但热门推荐的主要缺陷在于推
3、荐的范围有限,所推荐的内容在一定时期内也相对固定。无法实现长尾商品的推荐 个性化推荐可通过推荐系统来实现。推荐系统通过发掘用户的行为记录,找到用户的个性化需求,发现用户潜在的消费倾向,从而将长尾商品准确地推荐给需要它的用户,进而提升销量,实现用户与商家的双赢10.1.2 长尾理论 推荐系统的本质是建立用户与物品的联系,根据推荐算法的不同,推荐方法包括如下几类: 专家推荐 基于统计的推荐 基于内容的推荐 协同过滤推荐 混合推荐10.1.3 推荐方法完整的推荐系统: 用户建模模块:对用户进行建模,根据用户行为数据和用户属性数据来分析用户的兴趣和需求 推荐对象建模模块:根据对象数据对推荐对象进行建模
4、 推荐算法模块:基于用户特征和物品特征,采用推荐算法计算得到用户可能感兴趣的对象,并根据推荐场景对推荐结果进行一定调整,将推荐结果最终展示给用户10.1.4 推荐系统模型图: 推荐系统基本架构 目前推荐系统已广泛应用于电子商务、在线视频、在线音乐、社交网络等各类网站和应用中 如亚马逊网站利用用户的浏览历史记录来为用户推荐商品,推荐的主要是用户未浏览过,但可能感兴趣、有潜在购买可能性的商品10.1.5 推荐系统的应用图11-2 亚马逊网站根据用户的浏览记录来推荐商品 推荐系统在在线音乐应用中也逐渐发挥作用。音乐相比于电影数量更为庞大,个人口味偏向也更为明显,仅依靠热门推荐是远远不够的 虾米音乐网
5、根据用户的音乐收藏记录来分析用户的音乐偏好,以进行推荐。例如,推荐同一风格的歌曲,或是推荐同一歌手的其他歌曲10.1.5 推荐系统的应用图11-3 虾米音乐网根据用户的音乐收藏来推荐歌曲 推荐技术从被提出到现在已有十余年,在多年的发展历程中诞生了很多新的推荐算法。协同过滤作为最早、最知名的推荐算法,不仅在学术界得到了深入研究,而且至今在业界仍有广泛的应用 协同过滤可分为基于用户的协同过滤和基于物品的协同过滤 10.2.1 基于用户的协同过滤(UserCF) 10.2.2 基于物品的协同过滤(ItemCF) 10.2.3 UserCF算法和ItemCF算法的对比10.2 协同过滤 基于用户的协同
6、过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古老的算法 UserCF算法的实现主要包括两个步骤: 第一步:找到和目标用户兴趣相似的用户集合 第二步:找到该集合中的用户所喜欢的、且目标用户没有听说过的物品推荐给目标用户10.2.1 基于用户的协同过滤(UserCF)图11-4 基于用户的协同过滤(User CF)10.2.1 基于用户的协同过滤(UserCF) 实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度。目前较多使用的相似度算法有: 泊松相关系数(Person Correlation Coefficient) 余弦相似度(Cosine-based Sim
展开阅读全文