Hadoop大数据平台构建与应用课件项目2Hadoop大数据平台的构建.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Hadoop大数据平台构建与应用课件项目2Hadoop大数据平台的构建.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hadoop 数据 平台 构建 应用 课件 项目
- 资源描述:
-
1、Hadoop大数据平台构建与应用项目2 Hadoop大数据平台的构建AB项目描述通过分析学生专业课程技能考核、学生就业、学生学习兴趣、企业岗位需求、互联网招聘等数据信息,建立岗位模型、知识模型和学情模型,指导公司进行就业和学情分析系统的研发。在综合分析相关技术和应用实践的前提下,选择了主流的Hadoop大数据平台,并采用Apache Ambari管理平台构建Hadoop开发环境。任务2.1 搭建Ambari Hadoop系统任务描述1.借助学习论坛、网络视频等网络资源和各种图书资源,学习Cloudera Manager、Ambari和MapR等大数据平台管理工具。2.借助学习论坛、网络视频等网
2、络资源和各种图书资源,学习Hadoop生态系统的相关技术,了解各项技术的功能。3.完成Ambari的安装与配置。任务目标1.了解Hadoop背景知识,熟悉Hadoop的生态系统。2.学会Hadoop分布式集群的组建方法。3.学会Ambari Server和Ambari Agent的配置方法。知识准备1.认识Hadoop平台产品相比于SQL数据库,Hadoop在某些方面仍然显得不够完善。Cloudera、Hortonworks、MapR是最具有代表性的公司,他们带来众多的创新并提供强大的集群工具。这些管理工具分别是Cloudera Manager、Ambari和MapR,它们均能对集群进行自动化
3、安装、管理、监控、诊断和集成。如图2-1所示为3大Hadoop平台的供应商。下面向读者扩展一下这些公司的产品服务。图2-1 三大Hadoop平台的供应商图1-7 Apache Spark 开源项目(1)Cloudera图2-3 HDP资源栈(2)Hortonworks(3)MapR2.熟悉Hadoop生态系统MindmapSuitable for all categories business and personal presentation(14(1)Ambari(6)Pig(4)Oozie(5)Hive(13)Sqoop(11)YARN(12)HDFS(7)Shark(8)MapRedu
4、ce(3)HBase(2)ZooKeeper(9)Tez(10)Spark(14)Flume任务实施Ambari管理平台通过安装向导来进行集群的搭建,简化了集群供应。Ambari支持作业与任务执行的可视化与分析,能够更好地查看依赖和性能。Ambari是一个分布式架构的软件,主要由Ambari Server和 Ambari Agent两部分组成,如图2-5所示。图2-5 Ambari Server架构(1)基本环境配置本任务以两台节点为例来组建 Hadoop分布式集群,这里采用的系统版本为CentOS 7,具体要求见表2-1。根据表中的资源配置来组建大数据基础平台。图1-8 Apache Sto
5、rm开源项目主机名内存硬盘IP地址角色master8 GB100 GB192.168.200.131Ambari-Server、Ambari-Agent、MySQLslave14 GB100 GB192.168.200.133Ambari-Agent首先需要配置主机名。首先需要配置主机名。配置主机名。#master#hostnamectl set-hostname master#hostnamemaster#slave1#hostnamectl set-hostname slave1#hostnameslave11 修改 hosts 映射文件。#master#vi/etc/hosts192.1
6、68.200.131 master.hadoop master192.168.200.133 slave1.hadoop#slave1#vi/etc/hosts192.168.200.131 master.hadoop192.168.200.133 slave1.hadoop slave12 配置Yum源。#master将BigData-v2.0-BASE.iso复制到/mnt目录下,将其中的ambari 解压到/opt目录下,并在master节点配置ftp服务。注意:因为安装大数据相关软件包时,可能会用到相关依赖软件包,所以需要配置CentOS 7 Yum 源,可以配置CentOS 7的本地
7、Yum源文件,如果有网络的话也可以配置公网的Yum源。这里可以采用本地 CentOS 7 Yum 源。#master&slave1#cd/etc/yum.repos.d/#rm-vf*注意:如果配置公网Yum源,则不需要删除原来的repo文件。3编写REPO文件,指定Ambari安装包路径和CentOS 7安装包路径。#vi ambari.repo centos7baseurl=ftp:/192.168.2.10/centos7/(注:具体的Yum 源根据真实环境配置,本次为实验室测试环境。)gpgcheck=0 enabled=1 name=centos ambari name=ambari
8、baseurl=ftp:/10.0.3.61/ambari(注:具体的Yum 源根据真实环境配置,本次为实验室测试环境。)enabled=1 gpgcheck=0#master#yum-y install httpd将/mnt/目录下的HDP-2.4-BASE和HDP-UTILS-1.1.0.20两个文件夹拷贝到/var/www/html/目录下。启动httpd服务。#systemctl enable httpd.service#systemctl status httpd.service 配置ntp。#master#yum-y install ntp#vi/etc/ntp.conf注释或者删
9、除以下4行server 0.centos.pool.ntp.org iburst server 1.centos.pool.ntp.org iburst server 2.centos.pool.ntp.org iburstserver 3.centos.pool.ntp.org iburst添加以下两行server 127.127.1.0fudge 127.127.1.0 stratum 10#systemctl enable ntpd#systemctl start ntpd4#slave1#yum-y install ntpdate#ntpdate master.hadoop#syste
10、mctl enable ntpdate 配置SSH。#master&slave1检查 2个节点是否可以通过无密钥相互访问,如果未配置,则进行SSH无密码公钥认证配置。如下:#yum install openssh-clients#ssh-keygen#ssh-copy-id master.hadoop#ssh-copy-id slave1.hadoopssh登录远程主机查看是否成功。#ssh master.hadoop#exit#ssh slave1.hadoop#exit5 禁用 Transparent Huge Pages。操作系统后台有一个khugepaged 的进程,它会一直扫描所有进
11、程占用的内存,在可能的情况下会把4k page交换为Huge Pages,在这个过程中,对于操作的内存的各种分配活动都需要各种内存锁,直接影响程序的内存访问性能,并且这个过程对于应用是透明的,在应用层面不可控制,对于专门为4k page优化的程序来说,可能会造成随机的性能下降现象。#master&slave1#cat/sys/kernel/mm/transparent_hugepage/enabledalways madvise never#echo never /sys/kernel/mm/transparent_hugepage/enabled#echo never /sys/kernel
12、/mm/transparent_hugepage/defrag#cat/sys/kernel/mm/transparent_hugepage/enabledalways madvise never重启后失效,需要再次执行。6 安装配置 JDK。#master#mkdir/usr/jdk64/#mount-o loop XianDian-BigData-v2.0.5-BASE.iso/mnt/#cd/mnt/#tar-zxvf jdk-8u77-linux-x64.tar.gz-C/usr/jdk64/#vi/etc/profileexport JAVA_HOME=/usr/jdk64/jdk1
13、.8.0_77 export PATH=$JAVA_HOME/bin:$PATH#source/etc/profile#Java versionJava version 1.8.0_77Java(TM)SE Runtime Environment(build 1.8.0_77-b03)Java HotSpot(TM)64-Bit Server VM(build 25.77-b03,mixed mode)7#slave1#mkdir/usr/jdk64/#scp 172.24.14.106:/mnt/jdk-8u77-linux-x64.tar.gz.#tar-zxvf jdk-8u77-lin
14、ux-x64.tar.gz-C/usr/jdk64/#vi/etc/profileexport JAVA_HOME=/usr/jdk64/jdk1.8.0_77 export PATH=$JAVA_HOME/bin:$PATH#source/etc/profile#Java versionJava version 1.8.0_77Java(TM)SE Runtime Environment(build 1.8.0_77-b03)Java HotSpot(TM)64-Bit Server VM(build 25.77-b03,mixed mode)(2)配置Ambari Server#maste
展开阅读全文