基于bs4的html内容遍历

子孙遍历:

父>子

.contents .children .descendants(后两个只能用于for循环)

子>父

.parent .parents

同辈平行(不同的树干的同一级之间不能遍历)

.next_sibling .previous_sibling .next_siblings .previous_siblings

import bs4
for sinling in soup.a.previous(OR next)_siblings
print(sibling)

-格式化html使用命令.pretiffy
-bs4将读取的所有html文件采用utf-8格式进行编码

全部评论

相关推荐

饿魔:看到在线简历了吧
点赞 评论 收藏
分享
牛客41406533...:回答他在课上学,一辈子待在学校的老教授用三十年前的祖传PPT一字一句的讲解,使用谭浩强红皮书作为教材在devc++里面敲出a+++++a的瞬间爆出114514个编译错误来学这样才显得专业
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务