1、大数据处理架构教学设计大数据处理架构教学设计 课程标准课程标准 和和 教学目标教学目标 大数据处理的基本思想与架构大数据处理的基本思想与架构 教材内容:教材内容:第四章 第 2.1 节 适应的课程标准:适应的课程标准: 1.3 针对具体学习任务,体验数字化学习过程,感受利用数字化工具和资源的优势。 1.4 通过典型的应用实例,了解数据采集、分析和可视化表达的基本方法。 教学目标:教学目标: 通过分析大数据处理案例, 了解的大数据处理的 “分 治”思想。 通过对大数据实例的分析,了解静态数据、流数据 和图数据及其处理架构。 指向的核心素养:指向的核心素养: 计算思维: 总结利用计算机解决问题的过
2、程与方法, 并迁 移到与之相关的其他问题解决中。 数字化学习与创新: 在解决生活和学习中的问题时, 能评 估常见的数字化资源与工具对特定学习任务的价值,对其做 出合理的选择。 信息意识:能够根据解决问题的需要,自觉、主动地寻求 恰当的方式获取与处理信息;在合作解决问题的过程中,愿 意与团队成员共享信息,实现信息的更大价值。 教学环境:教学环境:有教学控制软件的多媒体机房。 建议课时:建议课时:1 课时 教学活动教学活动 设计设计 教学教学环节环节教学教学过程过程设计设计意图意图 新课导入新课导入分析生活中的分治思想应用,理解“分治”思想。引导学生从生活体验中提炼思想。 自主学习自主学习指导学生
3、沿问题线索自主阅读教材中 “处理大数据的分治思 想”案例,适时讨论。 问题问题 1 1:该案例中,如何使用 10 台计算机统计 10G 微博 数据中出现频率最高的词汇? 问题问题 2 2:该案例中,按问题 1 方法,使用 100 台计算机处 理 100G 数据时,遇到了什么问题,如何解决的? 问题问题 3 3: 该案例中, 按问题 2 方法, 使用 1000 台、 1 万台、 10 万台计算机处理更大量数据时,为什么行不通了?如何 解决的? 促使学生在问题引领下,层层深入的分析 案例、思考问题,理解大数据处理基本思 路。 问题设计思路:数据量和实时性的增长 单台计算机不能满足处理要求需要采用
4、多台计算机进行处理从多台计算机结构 的管理引出大数据处理的分治思想。 创设安静的环境,支持学生自主学习,同 时控制节奏。 学习评价学习评价学生总结问题答案及大数据处理基本思路,教师点评。通过交流与点评,帮助学生理解大数据处 理中的“分治”思想。 知识讲解知识讲解教师使用 PPT,从“大数据处理类型”图示展开,列举、分 析大数据应用实例中静态数据、 流数据、 图数据的不同特征; 讲解静态数据的批处理计算架构 Hadoop,从组成与功能的 层面,讲解分布式文件系统 HDFS、分布式数据库 HBase 和 分布式并行计算模型 MapReduce。 静态数据的批处理计算架构是难点,教师 可以结合“Ha
5、doop 的组成” “MapReduce 的 工作流程”图示进行分析讲解,帮助学生 化解学习中的难点。 拓展学习拓展学习布置任务,要求:阅读教材中流计算、图计算及实时处理与 批处理的整合容后,按小组分工,通过互联网针对流计算、 图计算进行拓展性学习, 并选择合适的方式将关键性学习资 源分享给全班同学。 流计算、图计算及实时处理与批处理的整 合内容教材中只是简单介绍,在批处理计 算的基础上,学生可以通过自主阅读,顺 利完成学习。 同时,流计算、图计算也是大数据处理的 重要内容,鼓励学生进行拓展性学习。 学习评价学习评价通过过程观察,选择完成好的流计算、图计算小组各一,进 行学习交流,教师点评。
6、通过交流与点评,促进学生较为全面、深 入的了解流计算、图计算处理架构。 反馈反馈每人一个小便签, 在便签上请同学们写上今天的收获、 困惑, 并用一句话说明大数据处理思想与类型(至多 20 个字) 。 贴 在黑板上。 常规活动,每次下课前让学生完成“收获- 困惑-理解”的便签,以便及时掌握学情。 作业布置作业布置基础作业(面向所有学生) : 完成本条目课后练习的 1-6 题。 提升作业(面向学有余力学生) : 结合教材上的拓展连接“分布式计算与并行处理” “Hadoop 的发展历史” “主要的流计算软件系统” “Hadoop 应用实例” ,通过互联网开展较为深入的拓展学习。 通过课后作业,促进学
7、生对课堂内容进行 反思、整理,以便加深和巩固学习效果、 促进思维发展。 根据学生的基础、能力及兴趣布置作业, 满足不同层次的学生需求。 教学设计教学设计 思路思路 按本章第一节课前对全章的整体规划和设计,本条目 1 课时,内容为大数据处理的分治思想和三种类型数据(静态 数据、流数据、图数据)的处理架构。 “大数据处理的分治思想”部分的内容,教材通过“统计过去一年微博数据中出现频率最高的 100 个词”案例的分 析深入浅出的进行了描述,较易理解。因此,我设计了问题链引领的自主学习活动。问题链的设计由浅入深,层层递进。 学生通过自主阅读、讨论后,可以逐个解决问题,逐步加深对大数据处理中“分治”思想
8、的理解。 “大数据处理类型”内容理论性强,较难理解。因此,我采用了讲授法、讨论法:从“大数据处理类型” “Hadoop 的组成” “MapReduce 的工作流程”图示开始,列举大数据应用实例中静态数据、流数据、图数据的不同特征;讲授三 种类型大数据处理的方法和架框:静态数据的批处理、流数据的实时计算、图数据的图计算及流计算与批处理的整合。 其中,重点讲授“分治”思想和静态数据的批处理计算架构 Hadoop,从组成与功能的角度,讲解分析分布式文件系统 HDFS、分布式数据库 HBase、分布式并行计算模型 MapReduce。 教材中流计算、图计算及实时处理与批处理的整合容只是简单介绍,简单易
9、懂。同时,流计算、图计算也是大数据 处理的重要内容。因此,我针对这部分,开展了拓展性学习:布置任务,要求:阅读教材中流计算、图计算及实时处理 与批处理的整合内容后,按小组分工,通过互联网针对流计算、图计算进行拓展性学习,并选择合适的方式将关键性学 习资源分享给全班同学。 最后通过问题与讨论中的第 1 题、思考与练习中的第 1 题、巩固与练习中的第 2 和 3 题,巩固、深化对大数据处理 思想与架构的认知。 针对针对 核心核心素养素养 培养的培养的 设计考虑设计考虑 本条目核心素养的具体落点如下: 计算思维计算思维:主要落点在主要落点在“总结利用计算机解决问题的过程与方法总结利用计算机解决问题的
10、过程与方法,并迁移到与之相关的其他问题解决中并迁移到与之相关的其他问题解决中” 。为此,特别 设计了学生自主学习大数据处理的“分治”思想的问题链,促使学生在问题引领下,层层深入的解决问题,理解大数据 处理中的分治思想,发展思维。在 Hadoop 架构组成及 MapReduce 工作流程教学活动中,设计教师通过结合“Hadoop 的 组成” “MapReduce 的工作流程”图示,结合相应案例分析,层层推进的进行分析讲解,引领学生掌握 Hadoop 在处理大 数据时的整体布局架构;MapReduce 工作流程中的分布式并行计算方法。 数字化学习与创新:主要落点在数字化学习与创新:主要落点在“在解
11、决生活和学习中的问题时,能评估常见的数字化资源与工具对特定学习任务的在解决生活和学习中的问题时,能评估常见的数字化资源与工具对特定学习任务的 价值,对其做出合理的选择价值,对其做出合理的选择” 。 信息意识:主要落点在信息意识:主要落点在“能够根据解决问题的需要,自觉、主动地寻求恰当的方式获取与处理信息;在合作解决问题能够根据解决问题的需要,自觉、主动地寻求恰当的方式获取与处理信息;在合作解决问题 的过程中,愿意与团队成员共享信息,实现信息的更大价值的过程中,愿意与团队成员共享信息,实现信息的更大价值” 。 为此设计了“按小组分工开展的流计算、图计算的拓展性学习”活动,要求学生借助互联网针对流计算、图计算主题, 主动地寻求恰当的方式获取有效的数字化资源进行学习,并选择合适的方式将关键性学习资源分享给全班同学。