大数据采集与爬虫课件任务5使用AJAX采集数据爬取汽车之家动态数据51525.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《大数据采集与爬虫课件任务5使用AJAX采集数据爬取汽车之家动态数据51525.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 采集 爬虫 课件 任务 使用 AJAX 汽车 动态 51525
- 资源描述:
-
1、任务任务5 5 使用使用 AJAX AJAX 采集数据采集数据 爬取爬取汽车之家动态数据汽车之家动态数据本章学习目标 了解AJAX的基本概念和数据特点 了解静态数据和动态数据基本知识 掌握web系统架构和操作系统内存管理中的使用和存放形式 掌握使用AJAX采集数据的实例 AJAX 基于已有的标准,这些标准已被大多数开发者使用多年。AJAX 是一种用于创建快速动态网页的技术。通过在后台与服务器进行少量数据交换,AJAX 可以使网页实现异步更新。这意味着可以在不重新加载整个网页的情况下,对网页的某部分进行更新。5.1 任务描述 本任务通过Chrome谷歌浏览器的“开发者工具”分析汽车之家网站页面数
2、据的各项内容,通过获得AJAX请求的URL,运用爬虫程序向AJAX请求动态数据,将采集到的动态数据进行过滤后保存至MySQL数据库中。5.2 AJAX5.2.1 AJAX的起源 在2005年,Google通过其 Google Suggest使AJAX 变得流行起来。Google Suggest 使用AJAX 创造出动态性极强的web界面:当您在谷歌的搜索框输入关键字时,JavaScript 会把这些字符发送到服务器,然后服务器会返回一个搜索建议的列表。5.2.2 AJAX的概述 AJAX(Asynchronous Javascript And XML)就是异步的Javascript 和XML。
3、AJAX 并不是一种新的编程语言,而仅仅是一种新的技术,它可以创建更好、更快且交互性更强的 Web 应用程序。在前面章节中学习了如何使用requests库来获取页面数据。但是,requests库只能获取的静态HTML页面的数据,如果页面当中存在使用Javascript 处理的数据的话,requests库是无法获取的。目前,越来越多的页面都在使用AJAX技术实现页面数据的动态处理。AJAX能够在传统的静态HTML页面加载完成之后,再异步地调用Javascript 向服务器获取某个接口的发送和接收特定数据,这种异步交互的数据格式包括XML。从页面处理的效果上看,AJAX能够在不刷新整个页面的情况下
4、,实现后台局部刷新。这样做的好处是显而易见的,浏览器不用每次都向服务器请求整个页面的全部数据,从而节约的网络带宽,减少了服务器工作负载,提高了web程序的整体性能。图5-1所示为AJEX和传统Web模式的区别。图5-1 AJAX和传统Web模式的区别 当前的Web应用程序发展来看,很多的WEB前端数据都是通过基于Javascript 框架实现与后端的数据交互。也就是说,不论后端使用何种语言,都能够很好地与基于Javascript 的框架实现数据交互。5.2.3 AJAX的特点 AJAX是基于Javascript 的一个对象。不同的浏览器对这个对象有着不同的支持。可以根据不同的浏览器,使用不同的
5、AJAX对象,实现数据的异步交互。下面来举例说明。对于比较早期版本的IE和IE6浏览器,可以分别使用var xmlHttp=new ActiveXObject(“Microsoft.XMLHTTP”)和var xmlHttp=new ActiveXObject(“Microsoft2.XMLHTTP”)获取AJAX对象。图5-2 AJAX实现兼容不同浏览器 对于目前主流的浏览器,可以使用var xmlHttp=new XMLHttpRequest()获取AJAX对象。因此,在实际的开发过程中,从浏览器兼容的角度出发,经常使用如下方法实现兼容,如图5-2所示。通过前面对不同浏览器实现兼容处理之后
展开阅读全文