书签 分享 收藏 举报 版权申诉 / 28
上传文档赚钱

类型大数据实践课件 Spark SQL.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4114940
  • 上传时间:2022-11-11
  • 格式:PPTX
  • 页数:28
  • 大小:2.77MB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《大数据实践课件 Spark SQL.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    大数据实践课件 Spark SQL 数据 实践 课件
    资源描述:

    1、第六章 Spark SQL6.1Spark SQL简介6.2分布式SQL引擎6.3使用DataFrame API处理结构化数据习题6.1 Spark SQL简介第六章 Spark SQLl Spark的结构化数据处理模块 l 提供分布式SQL查询引擎l 提供处理结构化数据的编程接口DataFrame第六章 Spark SQL6.1 Spark SQL简介Spark支持的结构化数据源 第六章 Spark SQL6.1 Spark SQL简介分布式SQL引擎的使用场景 (1)JDBC/ODBC(2)命令行第六章 Spark SQL6.1 Spark SQL简介DataFrame编程接口的使用 Sp

    2、ark SQL特性兼容Hive与Spark程序无缝集成统一的数据访问方法兼容Hive的数据、查询、用户定义函数在Spark程序中使用DataFrame API或SQL处理结构化数据第六章 Spark SQLDataFrame API与SQL类似,提供了一种操作结构化数据的标准方法6.1 Spark SQL简介多数据源支持HDFS、Hive、HBase、Parquet等第六章 Spark SQL6.1 Spark SQL简介Spark SQL架构 第六章 Spark SQL6.1 Spark SQL简介Spark SQL原理 Catalyst优化器 第六章 Spark SQL6.2分布式SQL引

    3、擎6.1 Spark SQL简介6.3使用DataFrame API处理结构化数据习题第六章 Spark SQL6.2 分布式SQL引擎Spark SQL环境配置机器名Spark角色Hadoop角色IP地址cloud1 Master NameNodeSecondaryNameNodeResourceManager 192.168.100.10 cloud2 SlaveMySQL元数据库 DataNodeNodeManager 192.168.100.11 cloud3 SlaveThrift JDBC/ODBC Server DataNodeNodeManager 192.168.100.12

    4、 在第五章Spark集群中增加MySQL元数据库和Thrift JDBC/ODBC Server第六章 Spark SQL6.2 分布式SQL引擎l MySQL元数据库搭建(1)准备MySQL数据库(2)创建数据库用户 sparksql(3)创建元数据库 hiveMetastorel MySQL-connector的配置(1)下载mysql-connector-java-5.1.41-bin.jar(2)配置conf/spark-env.sh(3)配置hive-site.xml第六章 Spark SQL6.2 分布式SQL引擎l 使用Spark SQL CLI(1)启动Spark SQL CL

    5、Icd/spark-2.1.0-bin-hadoop2.7./bin/spark-sql 第六章 Spark SQL6.2 分布式SQL引擎l 使用Spark SQL CLI(2)使用SQL操作数据常用数据操作SQL创建数据库create database mytestdb 查看数据库show databases 指定当前数据库use mytestdb创建表create table test_tbl(id int,name string,value int)查看表定义desc test_tbl 列出所有表show tables 插入数据insert into table test_tbl va

    6、lues(0,blue,10)查询数据select*from test_tbl where value15删除表drop table test_tbl删除数据库drop database mytestdb第六章 Spark SQL6.2 分布式SQL引擎l Thrift JDBC/ODBC Server的搭建与测试(1)启动Thrift JDBC/ODBC Server./sbin/start-thriftserver.sh 查看日志,检查是否启动成功:使用netstat命令查看thrift server监听的端口号:第六章 Spark SQL6.2 分布式SQL引擎l Thrift JDBC

    7、/ODBC Server的搭建与测试(2)使用Beeline测试Thrift JDBC/ODBC Server启动beeline./bin/beeline连接Thrift JDBC/ODBC Server!connect jdbc:hive2:/cloud3:10000 第六章 Spark SQL6.2 分布式SQL引擎l Thrift JDBC/ODBC Server的搭建与测试(3)使用SQL操作数据 查看数据库:指定当前数据库:use mytestdb第六章 Spark SQL6.2 分布式SQL引擎l Thrift JDBC/ODBC Server的搭建与测试(3)使用SQL操作数据

    8、查看数据库中的表:查询数据:第六章 Spark SQL6.3使用DataFrame API处理结构化数据6.1 Spark SQL简介6.2分布式SQL引擎习题第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 准备工作(1)准备多行Json数据格式文件test.json(1)上传文件至Hadoop hdfs中./bin/hadoop fs-put./test.json/testdata/第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使用Spark Shell编写程序(1)启动 Spark Shell./bin/spark-sh

    9、ell(2)读取json文件(1)过滤选择数据 第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使用Spark Shell编写程序(4)选择字段(5)输出结果 第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使用Spark Shell编写程序(6)通过Spark Web查看Spark SQL的执行情况 第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使用Spark Shell编写程序DataFrame转换流程 第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使

    10、用Spark Shell编写程序分析后的逻辑计划 优化后的逻辑计划 第六章 Spark SQL6.3 使用DataFrame API处理结构化数据l 使用Spark Shell编写程序物理计划 第六章 Spark SQL习题6.1 Spark SQL简介6.2分布式SQL引擎 6.3 使用DataFrame API处理结构化数据1.Spark SQL作为分布式SQL引擎有哪几种使用方法?2.Spark SQL中的DataFrame与RDD有何区别?3.DataFrame API支持哪些数据源?请列举3个。4.Catalyst优化器对DataFrame操作优化吗?5.Spark SQL CLI的元数据库和数据默认情况下分别存在什么地方?习题:感谢聆听

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:大数据实践课件 Spark SQL.pptx
    链接地址:https://www.163wenku.com/p-4114940.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库