书签 分享 收藏 举报 版权申诉 / 13
上传文档赚钱

类型Python爬虫程序设计KC24课件.pptx

  • 上传人(卖家):晟晟文业
  • 文档编号:4145412
  • 上传时间:2022-11-14
  • 格式:PPTX
  • 页数:13
  • 大小:60.86KB
  • 【下载声明】
    1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
    2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
    3. 本页资料《Python爬虫程序设计KC24课件.pptx》由用户(晟晟文业)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
    4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
    5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
    配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    Python 爬虫 程序设计 KC24 课件
    资源描述:

    1、2.4.1 获取元素节点的父节点获取元素节点的父节点2.4.1 获取元素节点的父节点获取元素节点的父节点BeautifulSoup通过:tag.parent获取tag节点的父节点,其中根节点的父节点是名称为document的节点,这个document节点的父节点是None。例例2-4-1:找出文档中:找出文档中The Dormouses story的的元素节点的所有父节点的名称。元素节点的所有父节点的名称。frombs4importBeautifulSoupdoc=TheDormousesstoryTheDormousesstoryOnceuponatimetherewerethreelitt

    2、lesisters;andtheirnameswereElsie,LacieandTillie;andtheylivedatthebottomofawell.soup=BeautifulSoup(doc,lxml)print(soup.name)tag=soup.find(b)whiletag:print(tag.name)tag=tag.parent程序结果:documentbpbodyhtmldocument由此可见节点的父节点依次为、2.4.2 获取元素节点的直接子元素节点获取元素节点的直接子元素节点2.4.2 获取元素节点的直接子元素节点获取元素节点的直接子元素节点BesutifulS

    3、oup通过:tag.children获取tag节点的所有直接子节点,包括element、text等类型的节点。例例2-4-2:获取:获取元素的所有直接子元素节点元素的所有直接子元素节点frombs4importBeautifulSoupdoc=TheDormousesstoryTheDormousesstoryOnceuponatime.soup=BeautifulSoup(doc,lxml)tag=soup.find(p)forxintag.children:print(x)程序结果:TheDormousesstoryOnceuponatime.节点下面有2个直接子节点元素,一个是eleme

    4、nt类型的节点TheDormousesstory,另外一个是text类型的节点Onceuponatime.2.4.3 获取元素节点的所有子孙元素节点获取元素节点的所有子孙元素节点2.4.3 获取元素节点的所有子孙元素节点获取元素节点的所有子孙元素节点BesutifulSoup通过:tag.desendants获取tag节点的所有子孙节点元素,包括element、text等类型的节点。例例2-4-3:获取:获取元素的所有子孙元素节点元素的所有子孙元素节点frombs4importBeautifulSoupdoc=TheDormousesstoryTheDormousesstoryOnceupon

    5、atime.soup=BeautifulSoup(doc,lxml)tag=soup.find(p)forxintag.descendants:print(x)程序结果:TheDormousesstoryTheDormousesDormousesstoryOnceuponatime.由此可见元素节点下面有下面几个子孙节点:The:这是一个text孙子节点,它是的子节点;Dormouses:这是下面的一个element孙子节点,是的子节点;Dormouses:这是下面的孙子text节点,即Dormouses的子节点;story:这是下面的孙子text节点,它是的子节点;Onceuponatime

    6、.:它是下面的text子节点;2.4.4 获取元素节点的兄弟节点获取元素节点的兄弟节点BesutifulSoup通过:tag.next_siblingtag.previous_sibling来获取下一个和前一个兄弟节点,其中tag.next_sibling是tag的临近的下一个兄弟节点,tag.previous_sibling是tag的临近的前一个兄弟节点。例例2-4-4:查找前后兄弟节点:查找前后兄弟节点 frombs4importBeautifulSoupdoc=TheDormousesstoryTheDormousesstoryOnceuponatime.soup=BeautifulSoup(doc,lxml)tag=soup.find(b)print(tag.previous_sibling)print(tag.next_sibling)tag=soup.find(i)print(tag.previous_sibling)print(tag.next_sibling)程序结果:NoneOnceuponatime.Thestory由此可见节点的前面兄弟节点为None,下一个兄弟节点是text节点Onceuponatime.,节点的前一个兄弟节点是text节点The,下一个是text节点story。

    展开阅读全文
    提示  163文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:Python爬虫程序设计KC24课件.pptx
    链接地址:https://www.163wenku.com/p-4145412.html

    Copyright@ 2017-2037 Www.163WenKu.Com  网站版权所有  |  资源地图   
    IPC备案号:蜀ICP备2021032737号  | 川公网安备 51099002000191号


    侵权投诉QQ:3464097650  资料上传QQ:3464097650
       


    【声明】本站为“文档C2C交易模式”,即用户上传的文档直接卖给(下载)用户,本站只是网络空间服务平台,本站所有原创文档下载所得归上传人所有,如您发现上传作品侵犯了您的版权,请立刻联系我们并提供证据,我们将在3个工作日内予以改正。

    163文库