Python BeautifulSoup 教程


#Python BeautifulSoup 教程


简介

根据 HTML 标签名获取元素

根据 class 获取元素

根据 id 获取元素

使用 name 获取 HTML 标签名

使用 get_text 获取 HTML 标签文本内容

使用 attrs 处理 HTML 标签属性

使用 decode_contents 获取 HTML 标签嵌套的 HTML 内容

嵌套获取元素

使用 find 和 find_all 查找元素

使用 select_one 和 select 查找元素

使用 append 追加内容

使用 insert 插入内容

使用 clear 清空内容

设置内容

使用 string 获取和设置 HTML 标签内容

使用 extract 删除 HTML 标签

使用 prettify 格式化 HTML

获取前后的同级元素

使用 find_previous、find_next 获取当前元素前后的元素

使用 find_parent 获取父元素

使用 wrap 为元素增加父元素

去除 HTML 中的注释

去除 HTML 中的 script

替换 href 属性内容

实战:解析 oschina 首页内容

实战:解析微信公众号文章列表



( 本文完 )