Python爬虫程序设计KC25.pptx
- 【下载声明】
1. 本站全部试题类文档,若标题没写含答案,则无答案;标题注明含答案的文档,主观题也可能无答案。请谨慎下单,一旦售出,不予退换。
2. 本站全部PPT文档均不含视频和音频,PPT中出现的音频或视频标识(或文字)仅表示流程,实际无音频或视频文件。请谨慎下单,一旦售出,不予退换。
3. 本页资料《Python爬虫程序设计KC25.pptx》由用户(三亚风情)主动上传,其收益全归该用户。163文库仅提供信息存储空间,仅对该用户上传内容的表现方式做保护处理,对上传内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知163文库(点击联系客服),我们立即给予删除!
4. 请根据预览情况,自愿下载本文。本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
5. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007及以上版本和PDF阅读器,压缩文件请下载最新的WinRAR软件解压。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Python 爬虫 程序设计 KC25
- 资源描述:
-
1、2.5.1 使用使用CSS语法语法2.5.1 使用使用CSS语法语法BeautifulSoup除了可以用find与find_all函数查找HTML文档树的节点元素外,还可以采用CSS类似的语法来查询,规则是:tag.select(css)其中tag是一个bs4.element.Tag对象,即HTML中的一个element节点元素,select是它的查找方法,css是类似css语法的一个字符串,一般结构如下:tagNameattName=value其中.部分是可选的;tagName是元素名称,如果没有指定就是所有元素;attName=value是属性名称,value是它对应的值,可以不指定属性,
2、在指定了属性后也可以不指定值;tag.select(css)返回一个bs4.element.Tag的列表,哪怕只有一个元素也时一个列表;例例2-5-1:soup.select(a)查找文档中所有查找文档中所有元素节点;元素节点;soup.select(p a)查找文档中所有节点下的所有元素节点;soup.select(pclass=story a)查找文档中所有属性class=story的节点下的所有元素节点;soup.select(pclass a)查找文档中所有具有class属性的节点下的所有元素节点;soup.select(aid=link1)查找属性id=link1的节点;soup.s
3、elect(body head title)查找下面下面的节点;soup.select(body class)查找下面所有具有class属性的节点;soup.select(body class a)查找下面所有具有class属性的节点下面的节点;下面的节点;例例2-5-2:查找查找HTML文档中所有文档中所有下面的下面的的链接的链接from bs4 import BeautifulSoupdoc=The Dormouses storyThe Dormouses storyOnce upon a time there were three little sisters;and their nam
4、es wereElsie,Lacie andTillie;and they lived at the bottom of a well.soup=BeautifulSoup(doc,lxml)tags=soup.select(pclass=story a)for tag in tags:print(taghref)程序结果:http:/ 另外我们通过tags=soup.select(p a)tags=soup.select(a)tags=soup.select(pclass a)等也可以得到一样的结果。2.5.2 属性的语法规则属性的语法规则在CSS结构中的attName=value中表示属性
展开阅读全文