python如何清除html文件中的内容


本文摘自php中文网,作者coldplay.xixi,侵删。

python清除html文件中内容的方法:1、使用join方法,代码为【pat = re.compile('>(.*?)<')''.join(pat.findall(test))】;2、使用compile方法。

本教程操作环境:windows7系统、python3.9版,DELL G3电脑,该方法适用于所有品牌电脑。

python清除html文件中内容的方法:

方法1:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

In [97]: str_ = ''

    ...: flag = 1

    ...: for ele in test:

    ...:     if ele == "<":

    ...:         flag = 0

    ...:     elif ele == '>':

    ...:         flag = 1

    ...:         continue

    ...:     if flag == 1:

    ...:         str_ += ele

    ...:        

In [98]: str_

Out[98]: 'just for testjust for testtest'

In [99]: str_ = ''

    ...: flag = 1

    ...: for ele in test:

    ...:     if ele == "<":

    ...:         flag = 0

    ...:     elif ele == '>':

    ...:         flag = 1

    ...:         ele = ' '

    ...:     if flag == 1:

    ...:         str_ += ele

    ...:        

In [100]: str_

Out[100]: ' just for test   just for test  test '

方法2:

1

2

3

4

5

6

import re

In [156]: pat = re.compile('(?<=\>).*?(?=\<)')

In [157]: pat.findall(test)

Out[157]: ['just for test', '', '', 'just for test', '', 'test']

In [158]: ''.join(pat.findall(test))

Out[158]: 'just for testjust for testtest'

方法3:

1

2

pat = re.compile('>(.*?)<')

''.join(pat.findall(test))

方法4:

1

2

3

In [167]: pat = re.compile('<[^>]+>', re.S)

In [168]: pat.sub('', test)

Out[168]: 'just for testjust for testtest'

大量免费学习推荐,敬请访问python教程(视频)

以上就是python如何清除html文件中的内容的详细内容,更多文章请关注木庄网络博客!!

相关阅读 >>

Python的random怎么用

Python if else用法是什么?

Python input怎么用

Python装饰器的深入浅出

Python数据分析师要学什么

Python处理excel xlrd的方法介绍

Python如何安装numpy

学习Python模块导入机制与大型项目的规范

Python能做回归么

Python如何实现网络爬虫

更多相关阅读请进入《Python》频道 >>




打赏

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码打赏,您说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦

分享从这里开始,精彩与您同在

评论

管理员已关闭评论功能...