当前第2页 返回上一页
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | import re
from bs4 import BeautifulSoup
from lxml import etree
html = '<p>你好</p><br/><font>哈哈</font><b>大家好</b>'
# 方法一
pattern = re.compile(r '<[^>]+>' ,re.S)
result = pattern.sub( '' , html)
print (result)
<br># 方法二
soup = BeautifulSoup(html, 'html.parser' )
print (soup.get_text())
# 方法三
response = etree.HTML(text=html)
# print (dir(response))
print (response.xpath( 'string(.)' ))
# 你好哈哈大家好
# 你好哈哈大家好
# 你好哈哈大家好
|
【推荐:python视频教程】
以上就是python怎么去除html标签的详细内容,更多文章请关注木庄网络博客!!
返回前面的内容
相关阅读 >>
Python gui编程(tkinter)是什么?实例展示Python tkinter教程
Python数字类型有哪些
Python配置与opencv的使用详解
Python判断两个list是否是父子集关系的实例
Python对多属性的重复数据去重
Python中的split是什么
Python怎么随机生成奇数
基于Python的2d图库matplotlib的图例、标题和标签介绍
Python绝对值怎么计算
Python是一种面向什么的语言?
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python怎么去除html标签