本文摘自php中文网,作者coldplay.xixi,侵删。
python清除html文件中内容的方法:1、使用join方法,代码为【pat = re.compile('>(.*?)<')''.join(pat.findall(test))】;2、使用compile方法。

本教程操作环境:windows7系统、python3.9版,DELL G3电脑,该方法适用于所有品牌电脑。
python清除html文件中内容的方法:
方法1:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 | In [97]: str_ = ''
...: flag = 1
...: for ele in test:
...: if ele == "<" :
...: flag = 0
...: elif ele == '>' :
...: flag = 1
...: continue
...: if flag == 1:
...: str_ += ele
...:
In [98]: str_
Out[98]: 'just for testjust for testtest'
In [99]: str_ = ''
...: flag = 1
...: for ele in test:
...: if ele == "<" :
...: flag = 0
...: elif ele == '>' :
...: flag = 1
...: ele = ' '
...: if flag == 1:
...: str_ += ele
...:
In [100]: str_
Out[100]: ' just for test just for test test '
|
方法2:
1 2 3 4 5 6 | import re
In [156]: pat = re.compile( '(?<=\>).*?(?=\<)' )
In [157]: pat.findall(test)
Out[157]: [ 'just for test' , '' , '' , 'just for test' , '' , 'test' ]
In [158]: '' .join(pat.findall(test))
Out[158]: 'just for testjust for testtest'
|
方法3:
1 2 | pat = re.compile( '>(.*?)<' )
'' .join(pat.findall(test))
|
方法4:
1 2 3 | In [167]: pat = re.compile( '<[^>]+>' , re.S)
In [168]: pat.sub( '' , test)
Out[168]: 'just for testjust for testtest'
|
大量免费学习推荐,敬请访问python教程(视频)
以上就是python如何清除html文件中的内容的详细内容,更多文章请关注木庄网络博客!!
相关阅读 >>
Python为什么要缩进控制
Python3列表的基础学习(附示例)
Python用什么数据库
Python安装了怎么用
Python中remove函数的用法是什么?
Python如何把数字变成日期
如何将Python中文件写入txt
Python中sep是什么意思
Python string、 bytes、 bytearray类型详解
Python使用matplotlib绘制3d图形(代码示例)
更多相关阅读请进入《Python》频道 >>
人民邮电出版社
python入门书籍,非常畅销,超高好评,python官方公认好书。
转载请注明出处:木庄网络博客 » python如何清除html文件中的内容